Fondamenti di Statistica e Serie Storiche con R
Classificato in Matematica
Scritto il in
italiano con una dimensione di 3,4 KB
Campionamento in R
Per effettuare un campionamento in R è possibile utilizzare la funzione sample(), che permette di costruire campioni casuali a partire da una popolazione, con o senza reimmissione dell’osservazione.
Campione Distorto
Un campione si definisce distorto quando la probabilità d’inclusione delle unità nel campione dipende da determinate caratteristiche della popolazione oggetto dello studio.
Regressione Multipla
Un modello di regressione multipla viene utilizzato per modellizzare una variabile dipendente (risposta) facendo uso di più variabili di riferimento (input). L'obiettivo è studiare la relazione tra diverse variabili.
Equazione di Regressione
Il modello lineare si esprime come:
Y = β0 + β1x1 + β2x2 + … + βnxn + ε
Dove:
- Y: variabile dipendente.
- x1, x2, ..., xn: variabili di input.
- ε: errore casuale.
Variabile Dummy
La variabile dummy è una variabile dicotomica o binaria (assume valori 0 o 1). È utilizzata per caratterizzare unità statistiche con specifici attributi (es. genere) o livelli (es. titoli di studio). Risulta particolarmente utile nell'approccio classico alle serie storiche per valutare la stagionalità.
Analisi delle Serie Storiche
Una serie storica è una successione di dati in cui ogni valore è associato a un definito istante temporale. Si compongono di una parte deterministica f(t) e una parte stocastica ut: Yt = f(t) + ut.
Approcci di Studio
- Approccio Classico: considera solo la parte deterministica; la componente stocastica è ritenuta trascurabile. È un metodo prevalentemente descrittivo.
- Approccio Moderno: modella la serie per effettuare previsioni. La parte stocastica non è più un errore trascurabile, ma una funzione finita di valori reali.
Tipologie di Serie Storiche
- Economiche: consumi, PIL.
- Demografiche: nati e morti.
- Finanziarie: prezzo di un’azione.
- Fisiche: temperatura dell’aria.
Intervallo di Confidenza
L'intervallo di confidenza è un intervallo entro il quale si stima ricada il parametro della popolazione con un elevato grado di fiducia, calcolato su un campione estratto. La probabilità associata (1-α) è detta livello di significatività o livello di confidenza, solitamente fissato al 95% o 99%.
Decomposizione delle Serie Storiche
Le componenti fondamentali di una serie storica sono:
- Trend (T): la tendenza di fondo del fenomeno nel lungo periodo.
- Ciclo (C): fluttuazioni caratterizzate da fasi ascendenti e discendenti collegate.
- Stagionalità (S): movimenti che si ripetono in modo analogo nel medesimo periodo dell'anno (fattori climatici o sociali).
- Componente Accidentale (A): tiene conto dell'imprevedibilità e della mancanza di una relazione perfetta tra le variabili.