Modelli di Regressione e Statistica Multidimensionale: Concetti Fondamentali
Classificato in Matematica
Scritto il in
italiano con una dimensione di 3,01 KB
Regressione Bivariata o Semplice
Una sola variabile indipendente sulla quale “regredisce” la variabile dipendente. Si ipotizza che la VI “determini” o “influenzi” la VD. Individuare la retta che “interpola” meglio la nuvola di punti (o “scatterplot”) della distribuzione congiunta delle due variabili. L’equazione che lega Y a X è la seguente:Y = α +βX Dove α intercetta punto in cui la retta incrocia l'asse delle ordinate β coefficiente angolare inclinazione della retta di regressione di Y su X; indica di quante unità cambia Y per una variazione unitaria che si verifica nella X Linearità: per ogni variazione in X si determina sempre la stessa variazione in Y qualunque sia il valore di X sull'asse delle ascisse.
REGRESSIONE POLINOMINALE
La regressione polinominale è una forma di regressione lineare in cui la relazione tra la variabile indipendente X e la variabile dipendente Y assume la forma di un poli nomio di grado in :
Y=beta0+beta1 X+beta2 X^2+betam X^m+epsilon
SCOPI E OBIETTIVI DELL’ANALISI MULTIDIMENSIONALE
L’analisi multimediale dei dati permette di considerare un determinato fenomeno statistico nelle sue molteplici dimensioni senza obbligare a chi effettua l’analisi ad effettuare delle ipotesi distribuzionali sulle variabili. La finalità è quella di rappresentare il fenomeno tenendo conto della sua complessità. L’analisi multimediale fa uso di matrice dati di grandi dimensioni. Un pacchetto in R per effettuare analisi multimediale è FactorMineR
RAGIONAMENTO SU Z
Il calcolo del valore Z riferito alla distribuzione normale standard consente di misurare la possibilità di estrarre un campione con il valore dato. Tale calcolo richiede che si conoscano media e deviazione standard della popolazione. Se non si posseggono informazioni sulla popolazione si utilizza la Dev. Std campionaria per stimare la varianza della popolazione. Questo è possibile dato che il valore atteso della varianza campionaria è una stima non distorta della varianza della popolazione. Dove per stima non distorta si intende non affetta da errore sistematico.
RESIDUO
Le relazioni tra variabili non sono perfette. I punti sono dispersi attorno alla retta di regressione. L’equazione deve incorporare un termine di errore chiamato residuo. (55) Coefficiente di correlazione campionaria r =(17), fornisce una misura del grado di corrispondenza tra i valori estremi di X e quelli di Y. In particolare, un valore di r prossimo a 1 indica che valori elevati di X sono fortemente associati a valori elevati di Y, di contro un valore prossimo a -1 indica che vi è corrispondenza tra valori grandi di X e piccoli di Y, e viceversa (65)
COEFFICIENTE DI DETERMINAZIONE R2
Formalmente rappresenta un indicatore di quanto bene il modello di regressione interpreti i dati. I valori di R2 vicini ad 1 rappresentano una buona aderenza, mentre valori prossimi a 0 una cattiva. R2=(52)