Concetti Fondamentali di Statistica Descrittiva e Probabilità

Classificato in Matematica

Scritto il in italiano con una dimensione di 3,63 KB

Eventi Dipendenti

Due eventi A e B si dicono dipendenti se il verificarsi dell’uno modifica la probabilità di verificarsi dell’altro. In caso di eventi dipendenti, la probabilità di ciascun evento successivo è condizionata dai risultati precedenti:

P(A ∩ B) = P(A) × P(B|A)

Dove P(B|A) è la probabilità che si verifichi l’evento B condizionato dal verificarsi di A.

Esempio: Estrazione dei numeri al lotto

Calcoliamo la probabilità che i primi 2 estratti siano pari:

  • Evento A: primo numero pari (P(A) = 45/90)
  • Se il primo è pari, allora P(B|A) = 44/89
  • Se il primo è dispari, P(B|A) = 45/89

La probabilità che i primi due numeri estratti siano pari è: P(A ∩ B) = 45/90 * 44/89 = 0,25

Strumenti di Rappresentazione Grafica

Istogramma

L'istogramma è un metodo grafico della statistica descrittiva, utilizzato per rappresentare la distribuzione delle frequenze di dati numerici. Le basi dei rettangoli indicano gli intervalli che definiscono le classi, mentre le altezze indicano la frequenza relativa alla classe.

Diagramma a barre

Nel diagramma a barre, ad ogni classe corrisponde una barra la cui base non ha significato intrinseco. È utile per rappresentare variabili di tipo categorico e l’altezza è proporzionale alla frequenza.

Boxplot

Il boxplot è un grafico relativo ai caratteri quantitativi che rappresenta il valore minimo, il primo quartile, la mediana, il terzo quartile e il valore massimo. Descrive le caratteristiche della distribuzione, fornendo informazioni sulla simmetria e sulla presenza di outliers (valori anomali).

Scatterplot

È un metodo grafico utile per stimare l’esistenza di correlazioni tra due variabili. In ascissa si posiziona una variabile e in ordinata l’altra, rappresentando le singole osservazioni con dei punti:

  • Correlazione diretta: i punti formano una retta verso destra.
  • Correlazione inversa: i punti formano una retta verso sinistra.
  • Scorrelazione: i punti formano una nuvola indistinta.

Indici Statistici e Frequenze

Frequenza relativa e percentuale

  • Frequenza relativa: il rapporto tra la frequenza assoluta e il numero totale delle osservazioni effettuate.
  • Frequenza percentuale: la frequenza relativa moltiplicata per cento.

Media campionaria

Assegnati n dati (x₁, x₂, ..., xₙ), la media campionaria (o media aritmetica) è il valore ottenuto sommando tutti i dati e dividendo per n. Essendo un indice che coinvolge tutte le osservazioni, è influenzata dai valori estremi.

Moda

La moda è l’elemento (o gli elementi) a cui corrisponde la massima frequenza assoluta. Non è influenzata da valori estremi e può essere utilizzata anche per dati qualitativi.

Mediana

È il valore centrale di una serie di n dati ordinati:

  • Se n è dispari: il valore che occupa la posizione (n+1)/2.
  • Se n è pari: la media dei valori che occupano le posizioni n/2 e (n/2)+1.

Come la media, si riferisce solo a dati quantitativi.

Range

Si definisce range la differenza tra il valore massimo e il valore minimo della serie di dati.

Scarto semplice medio campionario

Assegnata la serie di dati con media campionaria μ, lo scarto semplice medio campionario è la media aritmetica dei valori assoluti degli scarti dalla media.

Voci correlate: