CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
MODELUL LINIAR DE REGRESIE
Modelul de regresie:
yi = f(xi) + ui
(yi)i=1,,n - valorile reale ale variabilei dependente (sau efect, sau variabila endogena)
(xi)i=1,,n - valorile reale ale variabilei independente (sau cauza, sau variabila exogena)
(ui)i=1,,n - variabila reziduala - reprezinta influentele celorlalti factori ai variabilei y, nespecificati in model
Modelul liniar unifactorial:
yi = a + bxi + ui
I. Estimarea parametrilor a si b prin metoda celor mai mici patrate
T T
k- numarul variabilelor din model
Exemplu:
(xi)i=1,,n - suprafata comerciala in m2
(yi)i=1,,n - incasari medii lunare (in milioane lei)
Interpretare:
La cresterea suprafetei comerciale cu 1 m2 incasarile medii lunare vor creste cu 0,012 milioane lei lunar.
Pentru o suprafata comerciala de 0 m2 incasarile medii lunare sunt de 0,258 milioane lei (Atentie la posibilitatea existentei din punct de vedere economic a acestei situatii).
Observatie:
Pentru modelul liniar multifactorial se noteaza:
si
Pentru estimarea parametrilor se rezolva ecuatia matriceala:
II. Estimatorii si obtinuti prin metoda celor mai mici patrate sunt estimatori de verosimilitate maxima daca sunt verificate ipotezele:
1. Valorile observate nu sunt afectate de erori de masura
si
Exemplu:
sx si
sy si
Se verifica daca toate valorile observate pentru variabila x sunt in intervalul:
(81-3*39,1024; 81+3*39,1024), deci in (-36,3072;198,3072)
Se verifica daca toate valorile observate pentru variabila y sunt in intervalul:
(1,23-3*0,4818; 1,23+3*0,4818), deci in (-0,2154;2,6754)
2. Ipoteza de homoscedasticitate: variabila aleatoare reziduala u este de medie nula: M()=0 iar dispersia ei este constanta si independenta de x.
Pe baza acestei ipoteze este verificata stabilitatea legaturii antre x si y.
Se verifica daca:
Cov(x,u)=0
Daca nu este verificata acesta ipoteza se elimina fenomenul de heteroscedasticitate prin metoda regresiei ponderate:
yi = a + bxi + ui
Notand: si pentru se estimeaza parametrii modelului:
si se revine la modelul initial.
Exemplu:
yi = -12,72 + 0,37 xi
Cov (x,u) = -6,448/10 diferit de 0. Deci exista fenomenul de heteroscedasticitate.
Pentru eliminarea acestuia se estimeaza modelul obtinut prin metoda regresiei indirecte si se obtine:
Pentru acest model sunt verificate toate ipotezele si se revine la modelul initial:
3. Ipoteza de autocorelare a erorilor
Pentru a verifica daca erorile nu sunt autocorelate se va aplica testul Durbin Watson:
Din tabela Durbin Watson sunt preluate valorile d1 si d2 pentru un nivel de semnificatie a ales si pentru k=numarul variabilelor exogene iar n=numarul variabilelor observate.
0 < d < d1 T autocorelare pozitiva a erorilor
d1 d d2 T indecizie, recomandandu-se acceptarea autocorelarii pozitive
d2 < d < 4-d2 T erori independente
4-d2 d 4-d1 T indecizie, recomandandu-se acceptarea autocorelarii negative
4-d1<d<4 T autocorelare negativa a erorilor
Daca statistica Durbin Watson calculata nu se afla in intervalul al treilea erorile sunt autocorelate.
Pentru eliminarea autocorelarii se transforma modelul astfel:
unde
T
Deci:
Notand: se obtine un nou model:
Dupa estimarea parametrilor acestui model se revine la modelul initial.
4. Ipoteza de normalitate a valorilor variabilei reziduale
Se verifica daca pentru un nivel de semnificatie a este verificata relatia:
pentru orice i.
III. Semnificatia parametrilor estimati si
Se testeaza ipotezele:
si
Se calculeaza statisticile:
si
Pentru un prag de semnificatie a este extrasa valoarea ta din tabelul repartitiei Student.
Daca a este semnificativ.
Daca b este semnificativ.
Exemplu:
Daca modelul de regresie liniara estimat este:
Pentru un nivel de semnificatie a = 0,05 si n = 8 (numarul de observatii), valoarea tabelata a repartitiei Student este: t0,05;8 = 2,306.
Deci ta>t0,05;8 si tb>t0,05;8, deci a si b sunt semnificativi.
Observatie:
Daca b nu este obtinut semnificativ se poate spune ca variabila efect (y) nu este influentata liniar de catre variabila cauza (x).
IV. Verificarea verosimilitatii modelului
Verosimilitatea modelului este verificata cu ajutorul analizei dispersionale.
Sursa de variatie |
Masura variatiei |
Numarul gradelor de libertate |
Dispersiile corectate | |
Variatia datorata factorului x |
|
k-1 |
|
|
Variatia reziduala |
|
n-k |
|
|
Variatia totala |
|
n-1 |
k = numarul variabilelor din model
Pentru un nivel de semnificatie a si pentru k-1 si n-k grade de libertate valoarea tabelata a repartitiei Fisher este Fa;k-1;n-k
Daca Fcalc > Fa;k-1;n-k atunci modelul este verosimil.
Pentru a spune in ce masura variatia variabilei efect este datorata variatiei variabilei cauza se calculeaza raportul de corelatie:
Pentru testarea semnfificatiei raportului de corelatie se foloseste testul Fisher:
Daca Fcalc > Fa;k-1;n-k atunci raportul de corelatie este semnificativ.
Exemplu:
Acest model econometric descrie dependenta dintre cele doua variabile explicand 98,19% din variatia totala a variabilei dependente y.
sau
Variatia variabilei efect y se datoareaza in proportie de 98,19% variatiei variabilei cauza.
V. Previziune
Exemplu:
x'=130
t0,01=3,355
Intervalul de incredere:
y130
y130I
Observatie:
Pentru modelul multifactorial de regresie liniara:
Exemplu model de regresie liniar multifactorial:
Modelul de regresie:
p=2, n=13
T
In continuare sunt testate ipotezele modelului, semnificatia parametrilor si verosimilitatea modelului.
Pentru prognoza variabilei y pentru x1=64 si pentru x2=23:
t0,05;13-2-1=2,228
Intervalul de incredere:
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 1640
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved