Concetti Fondamentali di Statistica: Variabili, Distribuzioni e Misure di Tendenza Centrale
Classificato in Matematica
Scritto il in
italiano con una dimensione di 6 KB
Statistica: Definizioni e Ambiti
Statistica: Raccolta, organizzazione, sintesi, interpretazione e comunicazione di informazioni.
Statistica Descrittiva: Descrivere quantitativamente un certo numero di persone, luoghi o cose.
Statistica Inferenziale: Date le informazioni, è possibile trarre conclusioni su un gruppo di grandi dimensioni (popolazione) tramite una piccola parte del totale (campione).
Applicazioni: Sanità, imprese e industria.
Entità e Variabili
Entità (Unità Statistica): Si concentra l'attenzione su un gruppo di persone, luoghi o cose.
Variabile: È l'insieme delle caratteristiche delle entità interessate nella ricerca scientifica.
Tipi di Variabili
Variabile Casuale: Se i valori numerici di una variabile assumono valori casuali e se un particolare valore non può essere previsto in anticipo. Per rappresentare le variabili casuali si usano le lettere maiuscole X, Y e Z.
Variabile Continua: È quella che assume valori in un intervallo continuo (teoricamente infinito). Una variabile continua è misurata in modo uniforme.
Variabile Discreta: Quando i valori che una variabile può assumere sono separati da una certa quantità. Una caratteristica della variabile discreta è la presenza di lacune o interruzioni tra i valori che può assumere.
Variabile Quantitativa: I valori che può assumere sono i risultati di misure numeriche. Esempi: peso, temperatura, pressione arteriosa, altezza, numero di matricole e il numero di incidenti avvenuti in una regione geografica in un periodo di tempo.
Variabile Qualitativa: Una variabile i cui valori sono costituiti da categorie.
Distribuzioni di Frequenza
Distribuzione di Frequenza: È una rappresentazione delle categorie numeriche della variabile insieme al numero di soggetti che rientrano in ciascuna categoria.
Classi di Intervalli
Le categorie non sovrapposte e contigue si chiamano classi di intervalli.
L'Intervallo di Classe è identificato dal suo limite superiore e dal limite inferiore. I limiti di classe specificano i valori che possono essere inclusi in un dato intervallo di classe.
Tipi di Distribuzione
Distribuzione Cumulativa di Frequenza: I dati di una distribuzione di frequenza su base cumulativa. Questo può essere fatto attraverso una tabella; l'accumulo può cominciare con l'intervallo più piccolo o più grande.
Distribuzione Relativa di Frequenza: Proporzione o percentuale dei valori contenuti nelle diverse classi di intervalli. Fornisce informazioni sulla frequenza relativa o proporzione di osservazioni di diversa entità.
Rappresentazioni Grafiche
Istogramma
L'Istogramma rappresenta una distribuzione di frequenza o la distribuzione di frequenza relativa. Le sue caratteristiche sono:
- I possibili valori della variabile sono sull'asse orizzontale. La frequenza di comparsa dei valori è sull'asse verticale.
- Ogni intervallo di classe è rappresentato da una barra.
- Le barre hanno la stessa ampiezza degli intervalli di classe corrispondenti.
- L'altezza di una barra corrisponde alla frequenza di occorrenza dei valori nella classe corrispondente.
Poligono di Frequenza
Il Poligono di Frequenza è un'altra rappresentazione grafica dei dati di una distribuzione di frequenza. Si costruisce disegnando un istogramma e poi collegando con linee rette i punti medi della parte superiore di ogni barra.
Caratteristiche del Poligono
- Gli endpoint si uniscono all'asse orizzontale nel punto corrispondente al punto medio di un intervallo di classe immaginario adiacente all'istogramma (destra e sinistra).
- L'area totale sotto la curva è uguale all'area totale sotto l'istogramma.
Campionamento e Forme di Distribuzione
Campionamento Casuale Semplice: Metodo con cui i dati sono ottenuti su una popolazione da un campione. Questo processo è noto come Inferenza Statistica.
Forme del Poligono di Frequenza (Curtosi)
- Leptocurtica: Curva caratterizzata da una forte concentrazione di risultati nel centro di distribuzione.
- Mesocurtica: Ideale, prende la forma di una curva normale.
- Platicurtica: Prevale la condizione opposta (più piatta).
Si dice che la curva normale è simmetrica perché le due metà del poligono coincidono.
Altre Forme di Distribuzione
- Distribuzione rettangolare.
- Distribuzione a "U".
- Distribuzione bimodale: Spesso si verifica quando le distribuzioni di due diverse popolazioni sono rappresentate in un unico grafico.
Misure di Tendenza Centrale e Dispersione
Misure di Tendenza Centrale
Un singolo numero che indica il centro di una serie di numeri.
Media Aritmetica (Media): Il valore medio. Nota: Tutti i valori sostituiti entro un dato intervallo di classe sono pari al punto medio di tale intervallo.
Mediana: Il valore centrale di una serie ordinata di dati.
Moda: Il valore più ricorrente.
Misure di Dispersione
Range (Campo di Variazione): Massimo meno il minimo.
Varianza: Si ottiene sottraendo a ciascun valore la media, elevando al quadrato ciascuna differenza, sommando le differenze al quadrato e dividendo questo totale per il numero di valori meno uno ($n-1$).
Deviazione Standard: Radice quadrata della varianza.