Fondamenti di Statistica Descrittiva e Metodologie di Ricerca
Classificato in Matematica
Scritto il in
italiano con una dimensione di 6,63 KB
Concetti Fondamentali della Statistica
Popolazione: Rappresenta l'insieme di tutte le persone o unità su cui viene effettuato lo studio. Gli elementi sono le singole persone o cose che fanno parte della popolazione.
Variabili: Rappresentano l'oggetto dello studio. Il campione è la parte della popolazione selezionata per lo studio, utilizzata per generalizzare i risultati all'intera popolazione.
Tipologie di Variabili
- Variabili quantitative: Valori espressi numericamente.
- Discrete: Valori espressi in numeri interi, non supportano decimali.
- Continue: Valori espressi in numeri reali, supportano l'uso dei decimali.
- Variabili qualitative (attributi): Valori espressi in forma testuale.
- Ordinate: Seguono un ordine logico o gerarchico accettato.
- Non ordinate: Non presentano alcun ordine predefinito.
Fonti di Informazione e Raccolta Dati
Fonti primarie: Fondi che forniscono informazioni di prima mano, come interviste e questionari.
Fonti secondarie: Riflessioni o elaborazioni di dati primari, come censimenti e registri (es. ISTAT, INE).
Tabelle statistiche: Strumenti utilizzati per raccogliere e organizzare i dati ottenuti durante lo studio.
Tipologie di Frequenza
- Frequenza assoluta: Numero di volte in cui si presenta un determinato valore della variabile.
- Frequenza relativa: Risultato della divisione tra la frequenza assoluta e la dimensione del campione.
- Frequenza assoluta cumulata: Somma delle frequenze assolute dei valori uguali o minori a quello considerato.
Nota sugli intervalli: Maggiore è il numero di intervalli, più dettagliate sono le informazioni; tuttavia, se sono troppi, la lettura diventa difficile. Se sono troppo pochi, si perdono informazioni preziose. Quando il numero di valori è elevato, i dati vengono combinati in gruppi.
Rappresentazioni Grafiche
Per creare un grafico efficace, gli assi devono partire da 0 e gli spazi tra ogni intervallo devono essere uguali. Il tipo di grafico deve essere appropriato alle informazioni rappresentate:
- Grafico a colonne: Gli intervalli sull'asse orizzontale non devono essere necessariamente continui. L'altezza dei rettangoli dipende dal valore della variabile.
- Grafico a barre: Simile al grafico a colonne, ma con gli assi ruotati; i rettangoli sono disposti orizzontalmente.
- Grafico a linee: Consiste nell'unire i punti di intersezione dei valori dei due assi con una linea continua.
- Grafico delle proporzioni: Utilizza le percentuali per rappresentare la frequenza delle variabili.
- Grafico di dispersione: Mostra la distribuzione tra i valori osservati. Si utilizza principalmente per variabili quantitative continue.
Misure di Centralizzazione
- Media aritmetica: Somma di tutti i valori della variabile divisa per la dimensione del campione.
- Mediana: Valore centrale di una serie di dati disposti in ordine crescente o decrescente.
- Moda: Il valore della variabile che si presenta con la frequenza assoluta più elevata (quello che si ripete più spesso).
- Quartile: Ognuno dei tre punti che dividono la distribuzione in quattro parti uguali.
Misure di Dispersione
- Deviazione media: Consiste nel trovare la differenza tra i valori di ogni variabile e la media, dividendo poi per la dimensione del campione.
- Varianza: Consiste nell'elevare le deviazioni al quadrato per eliminare i segni negativi.
- Deviazione standard: È la radice quadrata della varianza.
- Coefficiente di variazione: Rapporto tra la deviazione standard e la media, espresso in percentuale.
- Curva di Lorenz: Grafico che mostra la concentrazione di una distribuzione di frequenza. Si traccia una diagonale dal punto 0: più la curva è vicina alla diagonale, minore è la concentrazione, e viceversa.
Associazioni Bivariata
- Variabile indipendente: Variabile che non viene modificata dall'altra.
- Variabile dipendente: Variabile influenzata dal comportamento della variabile indipendente.
- Forma: Si ottiene proiettando i valori delle due variabili in un sistema di coordinate. Se i punti seguono una linea retta o curva, esiste una relazione.
- Forza: Indica se la relazione tra le due variabili è significativa.
- Coefficiente di correlazione: Determina la forza e il senso del rapporto. È positivo se la direzione è verso l'alto, negativo se è verso il basso.
- Coefficiente di Spearman: Calibra la correlazione tra variabili basandosi su valori ordinali.
- Coefficiente di Pearson: Calibra la correlazione tra due variabili in base al loro valore effettivo.
Introduzione alla Statistica Multivariata
Analisi Fattoriale
Tecnica che mira a ridurre la dimensionalità dei dati, cercando di mantenere il massimo delle informazioni con il minimo numero di fattori. Può essere:
Analisi Confermatoria
Si basa su:
- Informazioni spaziali: Ogni variabile ha valori collocabili in uno spazio come coordinate.
- Matrice di correlazione: Studia il grado di connessione tra le variabili.
- Matrice fattoriale ed estrazione dei fattori: Indica la relazione tra fattori e variabili.
- Rotazione dei fattori: Ruota gli assi per migliorare la correlazione tra variabili e fattori.
- Interpretazione dei fattori: Studia la composizione di ogni fattore per comprenderne il contenuto.
Analisi Esplorativa
- Selezione delle variabili: Le variabili non sono scelte a caso, ma possono basarsi su fattori positivi precedenti.
- Misure di somiglianza o distanza: Definite dalla vicinanza tra i dati in base alla scala di misura.
- Algoritmo di clustering e metodi gerarchici: Processi che coinvolgono il raggruppamento o la separazione delle unità statistiche.