Concetti Fondamentali di Statistica: Variabili, Distribuzioni e Misure di Tendenza Centrale

Classificato in Matematica

Scritto il in italiano con una dimensione di 6 KB

Statistica: Definizioni e Ambiti

Statistica: Raccolta, organizzazione, sintesi, interpretazione e comunicazione di informazioni.

Statistica Descrittiva: Descrivere quantitativamente un certo numero di persone, luoghi o cose.

Statistica Inferenziale: Date le informazioni, è possibile trarre conclusioni su un gruppo di grandi dimensioni (popolazione) tramite una piccola parte del totale (campione).

Applicazioni: Sanità, imprese e industria.

Entità e Variabili

Entità (Unità Statistica): Si concentra l'attenzione su un gruppo di persone, luoghi o cose.

Variabile: È l'insieme delle caratteristiche delle entità interessate nella ricerca scientifica.

Tipi di Variabili

  • Variabile Casuale: Se i valori numerici di una variabile assumono valori casuali e se un particolare valore non può essere previsto in anticipo. Per rappresentare le variabili casuali si usano le lettere maiuscole X, Y e Z.

  • Variabile Continua: È quella che assume valori in un intervallo continuo (teoricamente infinito). Una variabile continua è misurata in modo uniforme.

  • Variabile Discreta: Quando i valori che una variabile può assumere sono separati da una certa quantità. Una caratteristica della variabile discreta è la presenza di lacune o interruzioni tra i valori che può assumere.

  • Variabile Quantitativa: I valori che può assumere sono i risultati di misure numeriche. Esempi: peso, temperatura, pressione arteriosa, altezza, numero di matricole e il numero di incidenti avvenuti in una regione geografica in un periodo di tempo.

  • Variabile Qualitativa: Una variabile i cui valori sono costituiti da categorie.

Distribuzioni di Frequenza

Distribuzione di Frequenza: È una rappresentazione delle categorie numeriche della variabile insieme al numero di soggetti che rientrano in ciascuna categoria.

Classi di Intervalli

Le categorie non sovrapposte e contigue si chiamano classi di intervalli.

L'Intervallo di Classe è identificato dal suo limite superiore e dal limite inferiore. I limiti di classe specificano i valori che possono essere inclusi in un dato intervallo di classe.

Tipi di Distribuzione

  • Distribuzione Cumulativa di Frequenza: I dati di una distribuzione di frequenza su base cumulativa. Questo può essere fatto attraverso una tabella; l'accumulo può cominciare con l'intervallo più piccolo o più grande.

  • Distribuzione Relativa di Frequenza: Proporzione o percentuale dei valori contenuti nelle diverse classi di intervalli. Fornisce informazioni sulla frequenza relativa o proporzione di osservazioni di diversa entità.

Rappresentazioni Grafiche

Istogramma

L'Istogramma rappresenta una distribuzione di frequenza o la distribuzione di frequenza relativa. Le sue caratteristiche sono:

  • I possibili valori della variabile sono sull'asse orizzontale. La frequenza di comparsa dei valori è sull'asse verticale.
  • Ogni intervallo di classe è rappresentato da una barra.
  • Le barre hanno la stessa ampiezza degli intervalli di classe corrispondenti.
  • L'altezza di una barra corrisponde alla frequenza di occorrenza dei valori nella classe corrispondente.

Poligono di Frequenza

Il Poligono di Frequenza è un'altra rappresentazione grafica dei dati di una distribuzione di frequenza. Si costruisce disegnando un istogramma e poi collegando con linee rette i punti medi della parte superiore di ogni barra.

Caratteristiche del Poligono

  • Gli endpoint si uniscono all'asse orizzontale nel punto corrispondente al punto medio di un intervallo di classe immaginario adiacente all'istogramma (destra e sinistra).
  • L'area totale sotto la curva è uguale all'area totale sotto l'istogramma.

Campionamento e Forme di Distribuzione

Campionamento Casuale Semplice: Metodo con cui i dati sono ottenuti su una popolazione da un campione. Questo processo è noto come Inferenza Statistica.

Forme del Poligono di Frequenza (Curtosi)

  • Leptocurtica: Curva caratterizzata da una forte concentrazione di risultati nel centro di distribuzione.
  • Mesocurtica: Ideale, prende la forma di una curva normale.
  • Platicurtica: Prevale la condizione opposta (più piatta).

Si dice che la curva normale è simmetrica perché le due metà del poligono coincidono.

Altre Forme di Distribuzione

  • Distribuzione rettangolare.
  • Distribuzione a "U".
  • Distribuzione bimodale: Spesso si verifica quando le distribuzioni di due diverse popolazioni sono rappresentate in un unico grafico.

Misure di Tendenza Centrale e Dispersione

Misure di Tendenza Centrale

Un singolo numero che indica il centro di una serie di numeri.

  • Media Aritmetica (Media): Il valore medio. Nota: Tutti i valori sostituiti entro un dato intervallo di classe sono pari al punto medio di tale intervallo.

  • Mediana: Il valore centrale di una serie ordinata di dati.

  • Moda: Il valore più ricorrente.

Misure di Dispersione

  • Range (Campo di Variazione): Massimo meno il minimo.

  • Varianza: Si ottiene sottraendo a ciascun valore la media, elevando al quadrato ciascuna differenza, sommando le differenze al quadrato e dividendo questo totale per il numero di valori meno uno ($n-1$).

  • Deviazione Standard: Radice quadrata della varianza.

Voci correlate: