Fondamenti di Statistica Descrittiva e Inferenziale: Concetti Chiave
Classificato in Matematica
Scritto il in
italiano con una dimensione di 4,4 KB
Concetti Fondamentali di Statistica e Probabilità
SCARTO INTERQUANTILE
Data una distribuzione di un carattere quantitativo oppure qualitativo ordinabile, si dicono quartili quei valori che ripartiscono la popolazione in quattro parti di uguale numerosità.
I quartili sono indici di posizione, come la media, la moda e la mediana campionaria, e sono strettamente legati a quest’ultima. Infatti:
- Il secondo quartile coincide con la mediana e divide la popolazione in due parti di uguale numerosità.
- Il primo e il terzo quartile sono le mediane delle due metà della popolazione.
- Il quartile zero coincide con il valore minimo della distribuzione.
- Il quarto quartile coincide con il valore massimo della distribuzione.
DEFINIZIONE DI PROBABILITÀ
Si definisce probabilità di un evento il rapporto fra il numero dei casi favorevoli ed il numero dei casi possibili, supposti tutti ugualmente possibili (Definizione Classica).
PROBABILITÀ CONDIZIONATA
Spesso si incontrano eventi che dipendono da altri eventi che si possono verificare precedentemente. Tali eventi influiranno sulla probabilità dell’evento successivo. In tal caso, occorre introdurre il concetto di probabilità condizionata.
La notazione $P(A|B)$ si legge: “la probabilità che si verifichi A dato che si è già verificato B”.
Esempio di Probabilità Condizionata
Esempio: 9 studenti (4 maschi e 5 femmine) partecipano a un concorso. Una delle femmine, Maria, ha una probabilità di vincita iniziale di $1/9$.
Prima dell’uscita dei risultati, trapela la notizia che la vincitrice è una femmina. La probabilità di vincita di Maria adesso è di $1/5$, perché nel concorso c’erano 5 femmine (il nuovo spazio degli esiti è ridotto alle sole femmine).
DEFINIZIONE DI ESPERIMENTO
Per esperimento si intende qualsiasi fatto o avvenimento che può essere osservato. Un esperimento è descritto da un enunciato, che può essere vero o falso.
DEFINIZIONE DELLO SPAZIO DEGLI ESITI
Si definisce spazio degli esiti (o spazio campionario) l’insieme di tutti i possibili esiti di un dato esperimento.
LA DISTRIBUZIONE NORMALE
La distribuzione normale (o Gaussiana) è fondamentale in statistica. Le sue caratteristiche più importanti sono:
- Ha una forma a campana ed è simmetrica.
- Le misure di posizione centrale (valore atteso e mediana) coincidono.
- La variabile aleatoria con distribuzione normale assume valori compresi tra $-\infty$ e $+\infty$.
Una variabile aleatoria $X$ si dice normale se ha una specifica funzione di densità.
Standardizzazione della Variabile Normale
La formula di trasformazione delle osservazioni, chiamata standardizzazione, consente di trasformare una generica variabile aleatoria normale in una variabile aleatoria normale standardizzata ($Z$).
La formula è:
$$Z = \frac{X - m}{s}$$
Dove $Z$ è la variabile ottenuta sottraendo a $X$ il suo valore atteso $m$ e rapportando il risultato allo scarto quadratico medio, $s$.
La variabile aleatoria $Z$ ha la caratteristica di avere valore atteso nullo ($m=0$) e scarto quadratico medio unitario ($s=1$).
MODELLI DI REGRESSIONE
REGRESSIONE LINEARE SEMPLICE
Il modello di regressione lineare semplice ha l’obiettivo di studiare la relazione o la dipendenza che esista tra una variabile dipendente $Y$ facendo uso di un solo regressore o variabile indipendente $X$.
Avremo quindi il modello:
$$Y_i = \beta_0 + \beta_1 x_i + \epsilon_i$$
REGRESSIONE MULTIPLA
La regressione multipla ha invece l’obiettivo di considerare la dipendenza che esista tra una variabile dipendente $Y$ e più regressori o variabili indipendenti $X_1, X_2, \dots, X_k$.
Il modello è:
$$Y_i = \beta_0 + \beta_1 x_1 + \dots + \beta_k x_k + \epsilon_i$$