Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
ComunicareMarketingProtectia munciiResurse umane

Execitiu - Teste asupra coeficientilor si variantei erorilor

management



+ Font mai mare | - Font mai mic



Execitiu - Teste asupra coeficientilor si variantei erorilor

Despre o firma, se cunosc datele referitoare la vanzarile de marfa, y, exprimate in mii euro, pe o perioada de 14 luni, numarul de angajati (persoane), x1, cheltuielile de intretinere a utilajelor, exprimate in euro, x2, si cheltuielile de publicitate pentru promovarea produselor, exprimate in euro, x3. Datele sunt prezentate in Tabelul 2.4:



t

y

x1

x2

x3

yt1

yt2

Tabelul 2.4. Datele referitoare la un agent economic

Se cere:

a) Sunt semnificative variabilele exogene in explicarea variatiei variabilei endogene? Sa se argumenteze si prin calculul intervalelor de incredere ale estimatorilor coeficientilor.

b) Coeficientul a1 este semnificativ mai mic decat 1?

c) Coeficientii a1 si a2 sunt semnificativi si simultan diferiti de 1, respectiv -0.5?

d) Care este intervalul de incredere pentru varianta erorii pentru un prag de semnificatie a

Solutie:

In Figurile 2.16, 2.17, si 2.18 sunt prezentate corelatiile dintre variabila dependenta, stabilita ca fiind vanzarile de marfa, influentata de celelalte variabile, considerate factori.

Figura 2.16. Legatura directa dintre valoarea vanzarilor si numarul de angajati

Figura 2.17. Legatura inversa dintre valoarea vanzarilor si cheltuielile cu utilajele

Se observa in cele trei grafice legaturile de natura directa ale vaorii vanzarilor cu numarul de angajati si cheltuielile de publicitate si de sens invers cu cheltuielile de intretinere a utilajelor. Cu cat sunt mai mari aceste cheltuieli de intretinere, cu atat se reduc vanzarile din cauza stagnarilor in productie pentru repararea utilajelor, cresterii costurilor de fabricatie si implicit a preturilor de vanzare a produselor, reducerii altor cheltuieli, cum ar fi cele de aprovizionare cu materii prime si materiale, salariile personalului angajat, etc.

Figura 2.18. Legatura directa dintre valoarea vanzarilor si cheltuielile de publicitate

In urma analizei de regresie, se asteapta un coeficient negativ pentru variabila explicativa a cheltuielilor de intretinere a utilajelor, x2 si coeficienti pozitivi pentru celelalte doua variabile independente x1 si x3.

Tabela de regresie este prezentata in Tabelul 2.5:

SUMMARY OUTPUT

Regression Statistics

Multiple R

R Square

Adjusted R Square

Standard Error

Observations

ANOVA 

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

X Variable 1

X Variable 2

X Variable 3

Tabelul 2.5. Tabela de regresie a modelului cu trei variabile explicative

Modelul este , iar valorile teoretice, yt1, se afla in Tabelul 2.4 si pe acelasi grafic care arata evolutia in timp a valorilor observate, in Figura 2.19.

Figura 2.19. Evolutia vanzarilor si ajustarea lor

a) Ratia Student pentru fiecare coeficient de regresie, calculata dupa formula , se compara cu valoarea teoretica Student pentru a=5% si 10 grade de libertate, .

, rezulta ca , variabila x1 contribuie la explicarea variatiei variabilei y;

, rezulta ca , variabila x2 contribuie la explicarea variatiei variabilei y;

, rezulta ca , variabila x3 nu contribuie la explicarea variatiei variabilei y, si poate fi retrasa din model. Se poate vedea in tabele de regresie din Tabelul 2.5 ca P-value pentru estimatorul , indica un prag de semnificatie de 49%, care este mult prea mare.

Intervalul de incredere al coeficientului ai se stabileste in functie de valoarea estimatorului, estimatia abaterii sale si valoarea teoretica Student pentru un prag de semnificatie ales, de obicei a=5%: .

Intervalele de incredere pentru cei trei estimatori ai coeficientilor variabilelor explicative sunt:

, semnul "+" indica legatura directa dintre y si x1;

, semnul "-" indica legatura inversa dintre y si x2 (Figura 2.17);

, se schimba semnul de la "-" la "+", poate lua valoarea 0, nu este semnificativ diferit de 0. Numai variabilele x1 si x2 sunt variabile exogene semnificative.

Pentru noul model cu doua variabile explicative, se obtine tabela de regresie prezentata in Tabelul 2.6. Valorile teoretice calculate cu acest model: se afa in Tabelul 2.4 si pe graficul din Figura 2.19.

Se poate observa ca acest model are coeficientii semnificativ diferiti de 0, dupa cum indica ratiile Student calculate, care sunt mai mari decat valoarea teoretica din tabela Student, valorile P-value, care sunt mai mici decat 5%, precum si intervalele de incredere ale coeficientilor, care nu schimba semnul de la limita inferioara la cea superioara, deci nu contin valoarea 0.

Intervalele de incredere sunt: , , .

Coeficientul de determinatie de 68.7% indica validitatea modelului liniar, iar coeficientul de corelatie multipla de 0.83 indica o corelatie puternica intre cele trei variabile y, x1 si x2.

SUMMARY OUTPUT

Regression Statistics

Multiple R

R Square

Adjusted R Square

Standard Error

Observations

ANOVA

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

X Variable 1

X Variable 2

Tabelul 2.6. Tabela de regresie a modelului cu doua variabile explicative

b) Intrebarile b), c) si d) ale exercitiului, se refera la modelul initial, cel cu trei variabile explicative, a carui tabela de regresie se afla in Tabelul 2.5.

Pentru a testa valoarea coeficientului a1 daca este semnificativ diferita de 1, ipotezele testului sunt:

H0: a1=1

H1: a1<1

Testul este unilateral la stanga, iar valoarea teoretica Student pentru 10 grade de libertate si a=5%, este 1.81. Presupunand adevarata ipoteza nula, raportul critic sau ratia Student calculata, devine: . Se accepa ipoteza nula, coeficientul a1 nu este semnificativ inferior valorii 1.

b)   Pentru a testa daca valorile coeficientilor a1 si a2 sunt semnificativi si simultan diferiti de 1, respectiv -0.5, se vor testa valorile estimatorilor lor, iar ipotezele sunt:

H0:

H1:

Valoarea q = 2 reprezinta numarul coeficientilor supusi testarii. Vectorul estimatorilor este si vectorul valorilor este . Matricea de varianta covarianta a estimatorilor este , iar . este:

Din matricea se decupeaza numai portiunea corespunzatoare coeficientilor si , care contine pe diagonala principala variantele celor doi estimatori, iar in rest covariantele:

Se calculeaza :

Vectorul este .

Vectorul este .

Statistica .

Valoarea Fisher calculata se compara cu o valoare teoretica pentru q=2 si n-k-1=10 grade de libertate, . Cum 0.612<4.10, se accepta ipoteza nula H0, adica cei doi coeficienti pot avea simultan valorile 1 si -0.5. Aceasta concluzie se poate verifica privind intervalele de incredere, care contin cele doua valori testate.

d) Pentru a stabili intervalul de incredere al variantei erorilor se citesc cele doua valori si , pentru 10 grade de libertate si pentru a=5%, astfel: pentru a/2=0.025 este 20.4831 si pentru (1-a/2)=0.975 este 3.24697.

Intervalul de incredere al variantei erorilor este , adica . Cu o probabilitate de 95%, varianta erorilor are sanse sa se gaseasca in acest interval.

2.6.3. Analiza variantei - testul Fisher de semnificatie globala a regresiei

Tabelul de analiza a variantei, ANOVA este de forma celui din Tabelul 2.7:

Natura variatiei, datorata:

Suma de patrate (Sum of Squares) SS

Grade de libertate

(degrees freedom) df

(Modified Sums) MS

Testul Fisher F

Regresiei (variabilelor explicative)

SSE=

k

SSE/k

Reziduurilor (varianta neexplicata)

SSR=

n-k-1

SSR/(n-k-1)

Totala (toti factorii)

SST=

n-1

Tabelul 2.7. Tabelul ANOVA la regresia multipla

Testul de semnificatie globala a regresiei se formuleaza astfel: exista cel putin o variabila explicativa semnificativa?

Ipotezele sunt:

H0: a1 = a2 = = ak = 0 (toti coeficientii sunt nuli, nici o variabila explicativa nu isi

aduce contributia la explicarea variabilei y; termenul constant a0 nu prezinta interes, deoarece un model in care numai termenul constant este semnificativ, nu are sens economic.)

H1: exista cel putin un coeficient nenul.

In cazul in care se accepta H0 inseamna ca nu exista nici o relatie liniara semnificativa intre variabila y si variabilele xi cu i=1,2, , k. Testarea ipotezei nule este echivalenta cu a testa daca varianta SSE este semnificativ diferita de 0.

In cazul exercitiului prezentat, tabelul de analiza variantei pentru modelul cu doua variabile explicative, dupa eliminarea variabilei nesemnificative x3, este extras din Tabelul 2.6, in Tabelul 2.8:

Natura variatiei 

df

SS

MS

F

Significance F

Regression

Residual

Total

Tabelul 2.8. Tabelul ANOVA pentru modelul cu doua variabile explicative

Ipoteza de normalitate a erorilor implica sub ipoteza H0, ca statistica F* urmeaza o lege Fisher cu k si n-k-1 grade de libertate. se compara cu o valoare teoretica Fisher cu 2 si 11 grade de libertate, care pentru un prag de semnificatie a=5% este Cum se accepta ipoteza alternativa, H1, deci regresia este global semnificativa, modelul este bine construit. Valoarea calculata F* corespunde unui prag de semnificatie de 0.16%, mult mai mic decat 5%.

Si regresia prezentata in Tabelul 2.5, cu trei variabile explicative, este global semnificativa pentru ca , iar valoarea calculata F*=7.87>3.71, pentru un prag de semnificatie de 0.54%.

Numai cand modelul are termen constant, F* se poate scrie in functie de coeficientul de determinatie R2. Din relatia , se poate exprima , iar SSR se poate exprima in functie de coeficientul de nedeterminatie , .

Inlocuind in formula statisticii F*, valorile astfel exprimate SSE si SSR, se simplifica cu SST si ramane astfel: .

Pe langa testul global de semnificatie, se efectueaza testele de semnificatie individuala a coeficientilor pentru fiecare variabila explicativa din model.

Calitatea ajustarii se determina in functie de coeficientul de determinatie: . Daca inseamna varianta totala SST, este aproape in intregime explicata SSE, modelul este bine ales. Coeficientul de determinatie multipla: , arata intensitatea corelatiei simultane a variabilelor explicative asupra variabilei dependente y.

Verificarea stabilitatii in timp a modelului - testul CHOW

Problema este daca modelul se poate considera ca fiind stabil pe intreaga perioada sau este mai bine sa se considere doua subperioade distincte de estimare? Specificarea modelului este aceeasi, dar valorile coeficientilor pot fi diferite.

Verificarea stabilitatii coeficientilor consta in a testa daca exista o diferenta semnificativa intre varianta neexplicata SSR pe ansamblul perioadei si suma variantelor neexplicate pe cele doua subperioade SSR1 + SSR2? Daca raspunsul este negativ, inseamna ca divizarea pe subperioade nu imbunatateste calitatea modelului, modelul initial este stabil pe intreaga perioada. In caz contrar se declara modelul ca fiind instabil si este mai bine sa se estimeze pe subperioade.

Testul de ipoteze este:

Se calculeaza valoarea Fisher, considerand n1, numarul de observari in prima subperioada si n2, numarul de observari in a doua subperioada, iar suma lor , este numarul total de observari din modelul initial:

Regula de decizie:

- se accepta H0, nu este nici o diferenta intre varianta reziduurilor calculata pe intreaga perioada si suma variantelor reziduurilor calculate pe subperioade; coeficientii sunt stabili pe intreaga perioada;

- se accepta H1, exista diferente semnificative intre varianta reziduurilor pe intreaga perioada si suma variantelor reziduurilor pe subperioade; coeficientii nu sunt constanti; modelul este instabil.

2.6.4.3. Testarea restrictiilor asupra coeficientilor

Estimarea econometrica valideaza restrictiile asupra coeficientilor, prin testul de ipoteze:

H0: SSR1=SSR (sunt verificate toate restrictiile?)

H1: SSR1≠ SSR (exista cel putin o restrictie neverificata),

unde SSR1 reprezinta varianta reziduurilor in modelul rezultat in urma restrictiilor, iar k' este numarul de variabile explicative din modelul restrictionat. Varianta reziduurilor din modelul initial este SSR, iar k este numarul variabilelor explicative din modelul initial.

Valoarea empirica a testului Fisher este valoarea sa calculata: . Gradele de liberate de la numarator se obtin scazand  gradele de libertate ale modelului initial din gradele de libertate ale modelului restrictionat: (n - k' - 1) - (n - k -1) = k - k'.

Daca , atunci se accepta ipoteza nula H0, restrictiile asupra coeficientilor sunt compatibile cu datele.

2.6.5. Exercitiu - Teste pornind de la analiza variantei

Reluind datele din aplicatia anterioara, referitoare la modelul cu trei variabile explicative:

(10.99) (0.298) (0.156) (0.052) ( ·) abaterea standard a coeficientilor

R2=0.7027

n=14

Sa se testeze urmatoarele ipoteze:

a)      Adaugarea variabilelor explicative x2 si x3 amelioreaza semnificativ calitatea ajustarii fata de estimarea numai in raport de variabila x1? Dar adaugarea numai a variabilei x2?

b)      Se poate considera modelul cu trei variabile, ca fiind stabil pe ansamblul perioadei sau trebuie sa se procedeze la estimarea pe subperioade: de la perioada 1 la 7 si de la 7 la 14?

c)      Un economist sugereaza ca in acest model a1=1 si a2=a3. Care este rezultatul testului asupra coeficientilor?

Solutie:

a)      Introducerea a doua variabile explicative suplimentare

Se executa urmatoarele operatiuni:

Calculul variantei totale, a celei explicate si a celei reziduale pentru modelul complet cu trei variabile explicative. Aceste valori se gasesc in tabela de regresie din Tabelul 2.5:

SSE=159.409

SSR=  67.448

SST=226.857

Calculul variantei totale, a celei explicate si a celei reziduale pentru modelul cu o singura variabila explicativa, x1. Aceste valori se gasesc in tabela de regresie din Tabelul 2.9:

SSE=117.659

SSR=109.198

SST=226.857 este evident aceeasi, indiferent de numarul variabilelor explicative, pentru ca masoara variatia datorata tuturor factorilor (inregistrati si reziduali).

SUMMARY OUTPUT

Regression Statistics

Multiple R

R Square

Adjusted R Square

Standard Error

Observations

ANOVA 

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

1.02E-05

X Variable 1

Tabelul 2.9. Tabele de regresie a modelului cu o singura variabila explicativa

Se observa ca R2=0.5186 este mai mic decat in cazul modelului initial, cu trei variabile explicative.

Testul statistic asupra ipotezelor:

H0: SSE-SSE1=0

H1: SSE-SSE1≠ 0

Valoarea calculata Fisher este:

Cum 3.09 < 4.10, rezulta ca se accepta ipoteza nula H0, adaugarea variabilelor x2 si x3 nu este importanta. Introducerea acestor variabile nu contribuie semnificativ la imbunatatirea calitatii ajustarii.

S-a discutat deja mai sus, si se poate vedea in tabela de regresie din Tabelul 2.5, ca variabila x3, nu este semnificativa, deoarece ratia sa Student este mai mica decat valoarea teoretica, fapt care a condus apoi la excluderea sa din model. Este interesant sa se analizeze daca introducerea unei singure variabile suplimentare, si anume x2, imbunatateste calitatea ajustarii.

Se vor parcurge aceeasi pasi, ca cei prezentati mai sus:

calculul variantei totale, a celei explicate si a celei reziduale pentru modelul cu doua variabile explicative, x1 si x2:

SSE=155.973

SSR=  70.884

SST=226.857

calculul variantei totale, a celei explicate si a celei reziduale pentru modelul cu o singura variabila explicativa, x1. Tabela de regresie se afla in Tabelul 2.9:

SSE=117.659

SSR=109.198

SST=226.857

Valoarea calculata Fisher este:

Cum 5.946 > 4.84, rezulta ca se respinge ipoteza nula H0, si se accepta ipoteza alternativa, H1, conform careia adaugarea variabilei x2 aduce o modificare semnificativa a variantei explicate. Introducerea variabilei x2 contribuie semnificativ la imbunatatirea calitatii ajustarii. Acest fapt este dovedit si de valoarea coeficientului de determinatie, care in cazul modelului cu doua variabile explicative este R2=0.6875 mai mare decat in modelul cu o singura variabila explicativa, x1, R2=0.5186.

b)      Testul Chow pentru verificarea stabilitatii in timp a modelului

Se va testa stabilitatea modelului cu trei variabile explicative.

Pasul 1: se estimeaza coeficientii modelului pentru prima subperioada, de la 1 la 7. Tabela de regresie obtinuta este prezentata in Tabelul 2.10:

SUMMARY OUTPUT

Regression Statistics

Multiple R

subperioada 1

R Square

Adjusted RSquare

Standard Error

Observations

ANOVA 

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

X Variable 1

X Variable 2

X Variable 3

Tabelul 2.10. Tabela de regresie pentru prima subperioada de la 1 la 7

Se observa in Tabelul 2.10, ca nici unul din coeficientii de regresie nu este semnificativ diferit de 0, valorile P-value sunt mai mari decat pragul acceptat de 0.05, toate intervalele de incredere ale estimatorilor coeficientilor schimba semnul de la - la +, deci contin valoarea 0. Nici testul Fisher nu indica o regresie global semnificativa, Significance F avand o valoare mult prea mare de 26.1%, fata de 5%, cat se accepta in mod obisnuit.

Variantele din tabelul ANOVA sunt:

SSE1=61.54

SSR1=27.32

SST2=88.86

Pasul 2: se estimeaza coeficientii modelului pentru a doua subperioada, de la 8 la 14; tabela de regresie se afla in Tabelul 2.11.

Concluzia este asemanatoare cu cea de la prima subperioada: ca nici unul din coeficientii de regresie nu este semnificativ, intervalele de incredere ale estimatorilor coeficientilor contin valoarea 0, testul Fisher nu indica o regresie global semnificativa.

Variantele din tabelul ANOVA, corespunzator celei de a doua subperioade, sunt:

SSE2=24.71

SSR2=20.72

SST2=45.43

SUMMARY OUTPUT

Regression Statistics

Multiple R

subperioada 2

R Square

Adjusted RSquare

Standard Error

Observations

ANOVA 

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

Intercept

X Variable 1

X Variable 2

X Variable 3

Tabelul 2.11. Tabela de regresie pentru a doua subperioada de la 8 la 14

Pasul 3: se calculeaza valoarea Fisher: .

Valoarea teoretica Fisher cu care se compara este .

Cum 0.606 < 4.53, rezulta ca se accepta ipoteza nula, H0, adica nu exista diferente semnificative intre varianta reziduurilor pe intreaga perioada si suma variantelor reziduale pe cele doua subperioade. Se poate accepta stabilitatea coeficientilor pe intreaga perioada.

c)      Testarea restrictiilor asupra coeficientilor

Ipotezele sunt:

H0: SSR1=SSR (toate restrictiile sunt verificate, nu exista modificari semnificative ale variantei reziduurilor)

H1: SSR1≠SSR (exista cel putin o restrictie neverificata, care determina modificarea semnificativa a variantei reziduurilor)

SSR1 reprezinta varianta reziduurilor modelului transformat, rezultat in urma restrictiilor, iar SSR este varianta reziduurilor modelului initial cu trei variabile explicative.

Restrictiile sunt: a1=1 si a2=a3.

Daca acesta ipoteza se verifica atunci modelul , devine

sau .

Se pot defini noi variabile si . Modelul devine . Tabelul 2.12 prezinta variabilele initiale si noile variabile definite, zt si vt.

Tabela de regresie pentru obtinerea modelului transformat sub ipoteza de verificare a restrictiilor este prezentata in Tabelul 2.13.

t

yt

x1

x2

x3

zt

vt

Tabelul 2.12. Variabilele initiale si cele transformate

SUMMARY OUTPUT

Regression Statistics

Multiple R

R Square

Adjusted R Square

Standard Error

Observations

ANOVA 

df

SS

MS

F

Significance F

Regression

Residual

Total

Coefficients

StandardError

t Stat

P-value

Lower 95%

Upper 95%

Intercept

X Variable 1

Tabelul 2.13. Tabela de regresie a variabilelor transformate

In noul model transformat , variantele sunt: SSE1 = 0.425, SSR1=108.789, SST1 = 109.214. Valoarea k reprezinta numarul variabilelor explicative din modelul trasformat, iar k=3.

Valoarea teroretica Fisher este: . Cum 3.065 < 4.10, rezulta ca se accepta ipoteza nula, adica toate restrictiile sunt compatibile cu datele, pentru ca nu exista diferenta semnificative intre varianta reziduurilor a modelului initial si cea a modelului transformat. Intervalele de incredere ale estimatorilor din Tabelul 2.5, dovedesc ca restrictiile pot fi indeplinite: intervalul de incredere pentru a1, cuprinde valoarea 1, iar intervalul pentru a3 este cuprins in intervalul de valori al coeficientului a2, deci cei doi coeficienti pot fi egali intre ei.

2.7. Previziuni folosind modelul regresiei multiple

Procedura de estimare a valorilor viitoare ale variabilei dependente, y, este similara cu cea utilizata la regresia simpla. Se cunosc valorile viitoare ale variabilelor explicative si in functie de acestea se stabilesc previziunile punctuale, dupa care, cu o anumita probabilitate se estimeaza intervalele de incredere ale acestor valori viitoare.

Pentru perioada de la 1 la n, cu t=1,n, modelul este: .

Previziunea pentru unitatea de timp t+h, unde h este orizontul de previziune, sau i+h, daca datele sunt observate in mod instantaneu este: .

Eroarea de previziune este: .

Conform ipotezelor modelului liniar general, previziunea este nedeplasata si se obtine prin aplicarea directa a modelului de regresie estimat. Se calculeaza varianta erorii de previziune, care permite determinarea unui interval de incredere pentru previziune. Aceasta varianta se calculeaza astfel:

Cunoscand vectorul , care contine valorile viitoare ale variabilelor explicative, se doreste obtinerea vectorului valorilor previzionate .

Eroarea de previziune urmeaza o lege normala de medie 0 si varianta , N(0, ). Inlocuind varianta erorilor cu varianta estimata, cea a reziduurilor , se deduce ca raportul

urmeaza o lege Student cu n-k-1 grade de libertate, k este numarul variabilelor explicative din model. Intervalul de incredere pentru un prag de semnificatie de a, este: .



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1742
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved