Concetti Fondamentali di Statistica Descrittiva e Probabilità
Classificato in Matematica
Scritto il in
italiano con una dimensione di 3,63 KB
Eventi Dipendenti
Due eventi A e B si dicono dipendenti se il verificarsi dell’uno modifica la probabilità di verificarsi dell’altro. In caso di eventi dipendenti, la probabilità di ciascun evento successivo è condizionata dai risultati precedenti:
P(A ∩ B) = P(A) × P(B|A)
Dove P(B|A) è la probabilità che si verifichi l’evento B condizionato dal verificarsi di A.
Esempio: Estrazione dei numeri al lotto
Calcoliamo la probabilità che i primi 2 estratti siano pari:
- Evento A: primo numero pari (P(A) = 45/90)
- Se il primo è pari, allora P(B|A) = 44/89
- Se il primo è dispari, P(B|A) = 45/89
La probabilità che i primi due numeri estratti siano pari è: P(A ∩ B) = 45/90 * 44/89 = 0,25
Strumenti di Rappresentazione Grafica
Istogramma
L'istogramma è un metodo grafico della statistica descrittiva, utilizzato per rappresentare la distribuzione delle frequenze di dati numerici. Le basi dei rettangoli indicano gli intervalli che definiscono le classi, mentre le altezze indicano la frequenza relativa alla classe.
Diagramma a barre
Nel diagramma a barre, ad ogni classe corrisponde una barra la cui base non ha significato intrinseco. È utile per rappresentare variabili di tipo categorico e l’altezza è proporzionale alla frequenza.
Boxplot
Il boxplot è un grafico relativo ai caratteri quantitativi che rappresenta il valore minimo, il primo quartile, la mediana, il terzo quartile e il valore massimo. Descrive le caratteristiche della distribuzione, fornendo informazioni sulla simmetria e sulla presenza di outliers (valori anomali).
Scatterplot
È un metodo grafico utile per stimare l’esistenza di correlazioni tra due variabili. In ascissa si posiziona una variabile e in ordinata l’altra, rappresentando le singole osservazioni con dei punti:
- Correlazione diretta: i punti formano una retta verso destra.
- Correlazione inversa: i punti formano una retta verso sinistra.
- Scorrelazione: i punti formano una nuvola indistinta.
Indici Statistici e Frequenze
Frequenza relativa e percentuale
- Frequenza relativa: il rapporto tra la frequenza assoluta e il numero totale delle osservazioni effettuate.
- Frequenza percentuale: la frequenza relativa moltiplicata per cento.
Media campionaria
Assegnati n dati (x₁, x₂, ..., xₙ), la media campionaria (o media aritmetica) è il valore ottenuto sommando tutti i dati e dividendo per n. Essendo un indice che coinvolge tutte le osservazioni, è influenzata dai valori estremi.
Moda
La moda è l’elemento (o gli elementi) a cui corrisponde la massima frequenza assoluta. Non è influenzata da valori estremi e può essere utilizzata anche per dati qualitativi.
Mediana
È il valore centrale di una serie di n dati ordinati:
- Se n è dispari: il valore che occupa la posizione (n+1)/2.
- Se n è pari: la media dei valori che occupano le posizioni n/2 e (n/2)+1.
Come la media, si riferisce solo a dati quantitativi.
Range
Si definisce range la differenza tra il valore massimo e il valore minimo della serie di dati.
Scarto semplice medio campionario
Assegnata la serie di dati con media campionaria μ, lo scarto semplice medio campionario è la media aritmetica dei valori assoluti degli scarti dalla media.