Fondamenti di Statistica Descrittiva e Metodologie di Ricerca

Classificato in Matematica

Scritto il in italiano con una dimensione di 6,63 KB

Concetti Fondamentali della Statistica

Popolazione: Rappresenta l'insieme di tutte le persone o unità su cui viene effettuato lo studio. Gli elementi sono le singole persone o cose che fanno parte della popolazione.

Variabili: Rappresentano l'oggetto dello studio. Il campione è la parte della popolazione selezionata per lo studio, utilizzata per generalizzare i risultati all'intera popolazione.

Tipologie di Variabili

  • Variabili quantitative: Valori espressi numericamente.
    • Discrete: Valori espressi in numeri interi, non supportano decimali.
    • Continue: Valori espressi in numeri reali, supportano l'uso dei decimali.
  • Variabili qualitative (attributi): Valori espressi in forma testuale.
    • Ordinate: Seguono un ordine logico o gerarchico accettato.
    • Non ordinate: Non presentano alcun ordine predefinito.

Fonti di Informazione e Raccolta Dati

Fonti primarie: Fondi che forniscono informazioni di prima mano, come interviste e questionari.

Fonti secondarie: Riflessioni o elaborazioni di dati primari, come censimenti e registri (es. ISTAT, INE).

Tabelle statistiche: Strumenti utilizzati per raccogliere e organizzare i dati ottenuti durante lo studio.

Tipologie di Frequenza

  • Frequenza assoluta: Numero di volte in cui si presenta un determinato valore della variabile.
  • Frequenza relativa: Risultato della divisione tra la frequenza assoluta e la dimensione del campione.
  • Frequenza assoluta cumulata: Somma delle frequenze assolute dei valori uguali o minori a quello considerato.

Nota sugli intervalli: Maggiore è il numero di intervalli, più dettagliate sono le informazioni; tuttavia, se sono troppi, la lettura diventa difficile. Se sono troppo pochi, si perdono informazioni preziose. Quando il numero di valori è elevato, i dati vengono combinati in gruppi.

Rappresentazioni Grafiche

Per creare un grafico efficace, gli assi devono partire da 0 e gli spazi tra ogni intervallo devono essere uguali. Il tipo di grafico deve essere appropriato alle informazioni rappresentate:

  • Grafico a colonne: Gli intervalli sull'asse orizzontale non devono essere necessariamente continui. L'altezza dei rettangoli dipende dal valore della variabile.
  • Grafico a barre: Simile al grafico a colonne, ma con gli assi ruotati; i rettangoli sono disposti orizzontalmente.
  • Grafico a linee: Consiste nell'unire i punti di intersezione dei valori dei due assi con una linea continua.
  • Grafico delle proporzioni: Utilizza le percentuali per rappresentare la frequenza delle variabili.
  • Grafico di dispersione: Mostra la distribuzione tra i valori osservati. Si utilizza principalmente per variabili quantitative continue.

Misure di Centralizzazione

  • Media aritmetica: Somma di tutti i valori della variabile divisa per la dimensione del campione.
  • Mediana: Valore centrale di una serie di dati disposti in ordine crescente o decrescente.
  • Moda: Il valore della variabile che si presenta con la frequenza assoluta più elevata (quello che si ripete più spesso).
  • Quartile: Ognuno dei tre punti che dividono la distribuzione in quattro parti uguali.

Misure di Dispersione

  • Deviazione media: Consiste nel trovare la differenza tra i valori di ogni variabile e la media, dividendo poi per la dimensione del campione.
  • Varianza: Consiste nell'elevare le deviazioni al quadrato per eliminare i segni negativi.
  • Deviazione standard: È la radice quadrata della varianza.
  • Coefficiente di variazione: Rapporto tra la deviazione standard e la media, espresso in percentuale.
  • Curva di Lorenz: Grafico che mostra la concentrazione di una distribuzione di frequenza. Si traccia una diagonale dal punto 0: più la curva è vicina alla diagonale, minore è la concentrazione, e viceversa.

Associazioni Bivariata

  • Variabile indipendente: Variabile che non viene modificata dall'altra.
  • Variabile dipendente: Variabile influenzata dal comportamento della variabile indipendente.
  • Forma: Si ottiene proiettando i valori delle due variabili in un sistema di coordinate. Se i punti seguono una linea retta o curva, esiste una relazione.
  • Forza: Indica se la relazione tra le due variabili è significativa.
  • Coefficiente di correlazione: Determina la forza e il senso del rapporto. È positivo se la direzione è verso l'alto, negativo se è verso il basso.
  • Coefficiente di Spearman: Calibra la correlazione tra variabili basandosi su valori ordinali.
  • Coefficiente di Pearson: Calibra la correlazione tra due variabili in base al loro valore effettivo.

Introduzione alla Statistica Multivariata

Analisi Fattoriale

Tecnica che mira a ridurre la dimensionalità dei dati, cercando di mantenere il massimo delle informazioni con il minimo numero di fattori. Può essere:

Analisi Confermatoria

Si basa su:

  • Informazioni spaziali: Ogni variabile ha valori collocabili in uno spazio come coordinate.
  • Matrice di correlazione: Studia il grado di connessione tra le variabili.
  • Matrice fattoriale ed estrazione dei fattori: Indica la relazione tra fattori e variabili.
  • Rotazione dei fattori: Ruota gli assi per migliorare la correlazione tra variabili e fattori.
  • Interpretazione dei fattori: Studia la composizione di ogni fattore per comprenderne il contenuto.

Analisi Esplorativa

  • Selezione delle variabili: Le variabili non sono scelte a caso, ma possono basarsi su fattori positivi precedenti.
  • Misure di somiglianza o distanza: Definite dalla vicinanza tra i dati in base alla scala di misura.
  • Algoritmo di clustering e metodi gerarchici: Processi che coinvolgono il raggruppamento o la separazione delle unità statistiche.

Voci correlate: