Concetti statistici fondamentali

Classified in Matematica

Written at on italiano with a size of 2,68 KB.

OUTLIERS

Un outliers è un valore molto diverso dal resto dei valori di un dataset, un metodo possibile per la loro identificazione sono i boxplot.

STIMATORE

A partire dallo stimatore possiamo ottenere un approssimazione per il parametro che si vuole stimare. Tipicamente questo è delle variabili campionarie. Uno stimatore può essere considerato una variabile aleatoria

STIMATORE PUNTUALE

Uno stimatore puntuale è uno stimatore che essendo comunque funzione delle variabili campionarie porti ad ottenere dalle stesse un unico singolo valore.

CONCETTO DI STIMATORE NON DISTORTO

Uno stimatore puntuale è non distorto per il parametro della popolazione Ɵ laddove

E(Ɵ^)=0

CONCETTO DI DISTORSIONE

La distorsione Ɵ^ è

D(Ɵ^)=E(Ɵ^-Ɵ)

STIMATORE ASINTOTICAMENTE NON DISTORTO

Uno stimatore puntuale è definito asintoticamente non distorto per il parametro della popolazione se la distorsione si riduce all’aumentare della dimensione del campione

STIMA

Ogni singolo valore che possa essere ottenuto dalla variabile aleatoria relativa allo stimatore è considerata una stima

STIMA PUNTUALE E STIMA INTERVALLARE

  • Una stima puntuale è una stima del parametro incognito della popolazione mediante un singolo valore
  • Una stima intervallare è una stima che faccia appunto uso di un intervallo che si assuma possa in maniera verosimile contenere il valore del parametro incognito

Esempi di stima

  • La stima della domanda media di un determinato prodotto
  • La stima del numero medio di oggetto venduti

STIMA PARAMETRICA

La stima parametrica parte dal concetto di inferenza statistica. L’inferenza statistica è un processo per cui sia possibile determinare le caratteristiche di una popolazione statistica considerata come oggetto dello studio, analizzando un sottoinsieme delle stesse unità statistiche, ovvero il campione selezionandola in maniera casuale. Il problema è che non conosciamo la distribuzione della popolazione. Di solito i parametri della distribuzione sono ignoti, quindi il problema sarà fare inferenza sui parametri sconosciuti dai dati osservati.

TEOREMA DEL LIMITE CENTRALE

La somma delle variabili aleatorie indipendenti in gran numero tende ad avere una distribuzione che si approssima ad una normale. Si definiscano : X1,X2,…,Xn un insieme di variabili aleatorie (i.i.d) e identicamente distribuite, le quali tutte possiedano media mu e varianza sigma.

Laddove possiamo avere n elevato delle medesime avremo specificamente che : X1,X2,…,Xn possiede un’approssimazione normale di media nmu e varianza nsigma^2.

Entradas relacionadas: