Fondamenti di Statistica e Serie Storiche con R

Classificato in Matematica

Scritto il in italiano con una dimensione di 3,4 KB

Campionamento in R

Per effettuare un campionamento in R è possibile utilizzare la funzione sample(), che permette di costruire campioni casuali a partire da una popolazione, con o senza reimmissione dell’osservazione.

Campione Distorto

Un campione si definisce distorto quando la probabilità d’inclusione delle unità nel campione dipende da determinate caratteristiche della popolazione oggetto dello studio.

Regressione Multipla

Un modello di regressione multipla viene utilizzato per modellizzare una variabile dipendente (risposta) facendo uso di più variabili di riferimento (input). L'obiettivo è studiare la relazione tra diverse variabili.

Equazione di Regressione

Il modello lineare si esprime come:

Y = β0 + β1x1 + β2x2 + … + βnxn + ε

Dove:

  • Y: variabile dipendente.
  • x1, x2, ..., xn: variabili di input.
  • ε: errore casuale.

Variabile Dummy

La variabile dummy è una variabile dicotomica o binaria (assume valori 0 o 1). È utilizzata per caratterizzare unità statistiche con specifici attributi (es. genere) o livelli (es. titoli di studio). Risulta particolarmente utile nell'approccio classico alle serie storiche per valutare la stagionalità.

Analisi delle Serie Storiche

Una serie storica è una successione di dati in cui ogni valore è associato a un definito istante temporale. Si compongono di una parte deterministica f(t) e una parte stocastica ut: Yt = f(t) + ut.

Approcci di Studio

  • Approccio Classico: considera solo la parte deterministica; la componente stocastica è ritenuta trascurabile. È un metodo prevalentemente descrittivo.
  • Approccio Moderno: modella la serie per effettuare previsioni. La parte stocastica non è più un errore trascurabile, ma una funzione finita di valori reali.

Tipologie di Serie Storiche

  • Economiche: consumi, PIL.
  • Demografiche: nati e morti.
  • Finanziarie: prezzo di un’azione.
  • Fisiche: temperatura dell’aria.

Intervallo di Confidenza

L'intervallo di confidenza è un intervallo entro il quale si stima ricada il parametro della popolazione con un elevato grado di fiducia, calcolato su un campione estratto. La probabilità associata (1-α) è detta livello di significatività o livello di confidenza, solitamente fissato al 95% o 99%.

Decomposizione delle Serie Storiche

Le componenti fondamentali di una serie storica sono:

  • Trend (T): la tendenza di fondo del fenomeno nel lungo periodo.
  • Ciclo (C): fluttuazioni caratterizzate da fasi ascendenti e discendenti collegate.
  • Stagionalità (S): movimenti che si ripetono in modo analogo nel medesimo periodo dell'anno (fattori climatici o sociali).
  • Componente Accidentale (A): tiene conto dell'imprevedibilità e della mancanza di una relazione perfetta tra le variabili.

Voci correlate: