CATEGORII DOCUMENTE |
Verificarea ipotezelor statistice
Definitia 1. Numim ipoteza statistica o presupunere relativa la o caracteristica X a unei populatii C, fie privind legea de probabilitate a lui X, fie privind parametrii de care depinde aceasta lege de probabilitate.
Definitia 2. Metoda prin care o ipoteza statistica ce trebuie verificata se accepta sau se respinge poarta numele de test (criteriu) statistic.
Observatia Daca testul statistic se refera la parametrii de care depinde legea de probabilitate a caracteristicii X, vom spune ca avem un test parametric, iar in caz contrar avem un test neparametric. Cand testul statistic se refera la natura legii de probabilitate (normala, exponentiala, etc.) spunem ca avem un test de concordanta.
Definitia 4. Fie caracteristica X cu cu legea de probabilitate, unde este un parametru necunoscut. Ipoteza principala ce se face asupra parametrului o numim ipoteza nula si o notam . Orice alta ipoteza ce se poate face relativ la parametrul o numim ipoteza admisibila. Notam ipotezele admisibile prin , .
Observatia 5. In continuare, relativ la parametrul , vom considera numai doua ipoteze, ipoteza nula si o ipoteza admisibila , numita ipoteza alternativa.
Observatia 6. Pentru verificarea ipotezei nule cu ipoteza alternativa , folosind o probabilitate de risc , se determina un domeniu , numit regiune critica, astfel incat , unde sunt variabilele de selectie. Din felul cum construim regiunea critica U, obtinem diferite teste de verificare a ipotezei statistice . Avand datele de selectie , se poate intampla ca , caz in care ipoteza nula este respinsa, sau , caz in care ipoteza nula este admisa.
Probabilitatea de risc poarta denumirea de nivel de simnificatie al testului.
Definitia 7. Numim eroare de genul I respingerea unei ipoteze adevarate, iar probabilitatea de producere a acestei erori este
si poarta numele de riscul furnizorului.
Numim eroare de genul II admiterea unei ipoteze false, iar probabilitatea de producere a acestei erori este
si poarta numele de riscul beneficiarului.
Definitia 8. Se numeste puterea testului probabilitatea de respingere a unei ipoteze false, adica
, unde , deci .
Observatia 9. Nu exista o metoda generala de construire a regiunii critice U, care sa ne conduca la testul de verificare , dar se cunosc clase de probleme pentru care s-au construit astfel de regiuni critice si corespunzator acestora avem diferite teste de verificare de ipoteze statistice.
Vom prezenta in continuare cateva teste de verificare a unor ipoteze statistice.
1. Testul Z
Se considera caracteristica X, ce urmeaza legea normala , unde este necunoscut, iar este cunoscut.
Relativ la media teoretica facem ipoteza nula , cu alternativa .
Pentru verificarea ipotezei nule cu alternativa precizata mai inainte, consideram o selectie repetata de volum n si nivelul de semnificatie . Fie datele de selectie si corespunzator variabilele de selectie . Daca se considera statistica
, unde ,
pe baza Observatiei 1.17, avem ca statistica Z urmeaza legea normala . Prin urmare, pentru , putem determina intervalul numeric astfel incat
.
Intr-adevar, avem ca
,
asadar, se ia astfel incat .
Se defineste regiunea critica dupa cum urmeaza
,
unde .
In acest fel am obtinut ca
.
Prin urmare, am determinat regiunea critica U, astfel incat sa fie satisfacuta relatia .
Folosind regiunea critica U, vom respinge ipoteza nula , daca , adica daca si o admitem daca , adica .
Observatia 10. Se vede ca regiunea critica U corespunde multimii complementare a intervalului numeric . Din acest motiv, in cele ce urmeaza, nu vom pune in evidenta, de fiecare data, regiunea critica U, ci numai intervalul numeric caruia ii apartine statistica utilizata pentru obtinerea acestei regiuni.
Observatia 11. Testul Z se poate folosi si pentru caracteristica X ce nu urmeaza legea normala, cand volumul n al selectiei este mare , avand in vedere ca statistica Z urmeaza aproximativ legea normala , unde si .
Observatia 12. (Etapele aplicarii testului Z).
1o Se dau: ;
2o Se determina astfel incat ;
30 Se calculeaza , unde ;
40 Concluzii: daca , ipoteza este admisa, in caz contrar ipoteza este respinsa.
Observatia 1 Deoarece ipoteza alternativa este , testul prezentat este testul Z bilateral. Daca ipoteza alternativa este , se obtine in mod analog testul Z unilateral stanga, respectiv pentru ipoteza alterantiva , se obtine testul Z unilateral dreapta.
De exemplu, pentru testul Z unilateral dreapta, intervalul numeric pentru statistica Z devine , unde este determinat astfel incat , iar regiunea critica U se modifica in mod corespunzator, adica
.
2. Testul T (Student)
Se considera caracteristica X ce urmeaza legea normala cu parametrii si necunoscuti. Relativ la aceasta caracteristica se face ipoteza nula cu ipoteza alternativa .
Pentru verificarea acestei ipoteze se considera o selectie repetata de volum n, cu datele de selectie si corespunzator variabilele de selectie .
Construim statistica , unde, dupa cum se stie , , care, conform Observatiei 1.22, urmeaza legea Student cu n-1 grade de libertate.
Prin urmare, pentru nivelul de semnificatie dat, se poate determina intervalul numeric astfel incat
.
Anume, se determina astfel ca , unde
,
este functia de repartitie pentru legea Student cu m grade de libertate (tabelata in Anexa II, pentru anumite valori).
Complementarea intervalului numeric, astfel determinat, ne defineste regiunea critica . Astfel, avem ca
,
unde , respectiv .
Observatia 14 (Etapele aplicarii testului T).
1o Se dau: ;
2o Se determina astfel incat ;
30 Se calculeaza , unde , ;
40 Concluzii: daca , ipoteza este admisa, in caz contrar ipoteza este respinsa.
Observatia 15. Deoarece ipoteza alternativa este , testul prezentat este testul T bilateral. Daca ipoteza alternativa este , se obtine in mod analog testul T unilateral stanga, respectiv pentru ipoteza alterantiva , se obtine testul T unilateral dreapta.
Cand numarul gradelor de libertate tinde spre infinit, conform teoremei limita centrala, avem ca legea Student converge in repartitie la legea normala .
Prin urmare, daca volumul n al selectiei este mare , se poate utiliza testul Z pentru verificarea ipotezei nule , prin utilizarea statisticii T in loc de statistica Z. Toate rezultatele de la testul Z raman, asadar, adevarate in acest caz.
Teste pentru compararea a doua medii
Se considera doua populatii independente si cercetate din punct de vedere al aceleiasi caracteristici. Aceasta caracteristica este pentru si urmeaza legea normala si respectiv pentru si urmeaza legea normala .
Relativ la mediile teoretice ale celor doua caracteristici independente se face ipoteza nula cu alternativa .
Pentru aceasta se considera cate o selectie repetata de volum si respectiv din cele doua populatii. Notam datele de selectie prin si respectiv , si variabilele de selectie , respectiv
Reamintim notatiile
, ,
, ,
pentru mediile de selectie si respectiv dispersiile de selectie.
Distingem in cele ce urmeaza trei cazuri, in functie de anumite informatii ce le cunoastem relativ la dispersiile teoretice.
a). Testul Z (daca dispersiile si sunt cunoscute). In acest caz se considera statistica , care urmeaza legea normala . Se aplica prin urmare testul Z pentru compararea celor doua medii teoretice.
Pentru nivelul de semnificatie dat se determina intervalul numeric , astfel incat . Stabilirea acestui interval se obtine din relatia , unde este functia lui Laplace si care este tabelata in Anexa I.
In acest caz, etapele aplicarii testului sunt:
1o Se dau: ;
2o Se determina astfel incat ;
30 Se calculeaza , unde , si
40 Concluzii: daca , ipoteza este admisa, in caz contrar ipoteza este respinsa.
b). Testul T (daca dispersiile si sunt necunoscute si ). Se considera statistica
, care urmeaza legea Student cu grade de libertate.
In acest caz se va aplica testul T. Pentru nivelul de semnificatie dat se poate determina intervalul numeric , astfel incat . Pentru aceasta se foloseste relatia , unde este functia de repartitie de la legea Student cu n grade de libertate si care este tabelata, pentru anumite argumente, in Anexa II.
Etapele aplicarii testului sunt:
1o Se dau: ; ;
2o Se determina astfel incat ;
30 Se calculeaza , unde , , , ;
40 Concluzii: daca , ipoteza este admisa, in caz contrar ipoteza este respinsa.
c) Testul T (daca dispersiile si sunt necunoscute si diferite). Se va considera statistica
,
care urmeaza legea Student cu n grade de libertate. Numarul n al gradelor de libertate se calculeaza cu formula , unde .
S-a ajuns la testul T, care pentru nivelul de semnificatie dat, conduce la intervalul numeric , astfel incat
.
Pentru aceasta se foloseste relatia , unde este functia de repartitie de la legea Student cu n grade de libertate si care este tabelata, pentru anumite argumente, in Anexa II.
Etapele aplicarii testului sunt:
1o Se dau: ;
2o Se calculeaza
, ,
, ,
de unde ;
30 Se determina n astfel incat ;
4o Se determina astfel incat ;
50 Se calculeaza ;
60 Concluzii: daca , atunci ipoteza este admisa, in caz contrar ipoteza este respinsa.
4. Testul (hi-patrat) pentru dispersie
Fie caracteristica X ce urmeaza legea normala , unde dispersia teoretica este necunoscuta si de asemenea necunoscut.
Relativ la dispersia teoretica se face ipoteza nula cu ipoteza alternativa .
Pentru verificarea ipotezei nule cu alternativa se considera o selectie repetata de volum n, cu datele de selectie si corespunzator variabilele de selectie .
Statistica , urmeaza legea cu grade de libertate.
Pentru un nivel de semnificatie dat, se poate determina un interval numeric astfel incat
.
Extremitatile acestui interval numeric se determina din relatiile
si ,
unde este functia de repartitie pentru legea cu m grade de libertate, adica , fiind tabelata pentru anumite valori in Anexa III.
Cu ajutorul intervalului numeric astfel determinat, regiunea critica va fi data de complementarea acestui interval, adica
,
unde .
Observatia 16 (Etapele aplicarii testului ).
1o Se dau: ;
2o Se determina intervalul astfel incat
si ;
30 Se calculeaza , unde ;
40 Concluzii: daca , ipoteza este admisa, in caz contrar este respinsa.
5. Testul F (Snedecor-Fisher)
Se considera doua populatii independente si cercetate din punct de vedere al aceleasi caracteristici. Aceasta caracteristica este pentru si urmeaza legea normala si respectiv pentru si urmeaza legea normala .
Relativ la dispersiile teoretice ale celor doua caracteristici se face ipoteza nula cu alternativa .
Pentru verificarea ipotezei nule se efectueaza cate o selectie repetata de volum respectiv si din cele doua populatii si . Notam datele de selectie prin si respectiv , si variabilele de selectie , respectiv
Cu notatiile
, ,
,
avem ca statistica , urmeaza legea Snedecor-Fisher cu si grade de libertate. Prin urmare, statistica F are functia de repartitie, pentru , data prin
.
Pentru un nivel de semnificatie fixat se poate determina intervalul numeric , astfel incat
.
Extremitatile acestui interval se determina din relatiile
si .
Deoarece are loc relatia , tabelele pentru functia sunt, de regula, intocmite numai pentru valori mari ale lui (0,95, 0,975, 0,99 in Anexa IV) si pentru .
Daca , intervalul numeric pentru F este dat prin
Observatia 17 (Etapele aplicarii testului F).
1o Se dau: ;
2o Se determina intervalul astfel incat
si ;
30 Se calculeaza , unde
, ,
,
40 Concluzii: daca, atunci ipoteza este admisa, in caz contrar este respinsa.
6. Testul de concordanta
Fie caracteristica X, care are functia de repartitie teoretica F. Ipoteza statistica nula ce o facem relativ la caracteristica X este
,
unde sunt parametri necunoscuti.
Pentru a verifica aceasta ipoteza statistica, la inceput, folosind datele de selectie , se estimeaza prin metoda verosimilitatii maxime parametrii . Fie estimatiile de verosimilitate maxima pentru acesti parametri, respectiv . Prin urmare, ipoteza nula devine .
Se efectueaza apoi gruparea datelor de selectie , conform Observatiei 1.11 si Observatiei 1.12, obtinandu-se distributia empirica de selectie . Pentru clasa , data de intervalul avem ca , , probabilitati necunoscute, deoarece functia de repartitie teoretica F este necunoscuta.
Din ipoteza nula se poate calcula probabilitatea
.
In acest fel ipoteza nula , facuta asupra functiei de repartitie, se poate rescrie in , cu ipoteza alternativa falsa.
Valoarea numerica este valoarea unei variabile aleatoare ce urmeaza legea de probabilitate cu grade de libertate.
Asadar, pentru probabilitatea de risc se considera intervalul de incredere pentru , definit prin relatia
, adica .
Aici functia este functia de repartitie pentru legea cu numarul gradelor de libertate si care este tabelata in Anexa III.
Observatia 18 (Etapele aplicarii testului ).
1o Se considera: ;
2o Se determina estimatiile de verosimilitate maxima ;
30 Se determina distributia empirica de selectie ;
4o Se calculeaza probabilitatile
, ;
50 Se calculeaza astfel incat ;
60 Se calculeaza ;
70 Concluzii: daca , ipoteza statistica este admisa, in caz contrar ipoteza este respinsa.
Observatia 19. Testul de concordanta nu este aplicabil daca exista mai mici decat 5, caz in care se cere o regrupare a datelor de selectie.
7. Testul de concordanta al lui Kolmogorov
Fie caracteristica X de tip continuu, avand functia de repartitie teoretica F. Daca este functia de repartitie de selectie, conform Corolarului 1.27, avem ca
, unde , iar este functia lui Kolmogorov si este tabelata in Anexa V.
Se face ipoteza nula ca X urmeaza legea de probabilitate data de functia de repartitie . Daca ipoteza nula este adevarata, pentru probabilitatea de risc , se poate determina valoarea astfel incat .
Astfel, avem sau .
Asadar, daca valoarea calculata a lui pentru datele de selectie, satisface inegalitatea , vom admite ipoteza nula, in caz contrar o respingem.
Observatia 20 (Etapele aplicarii testului Kolmogorov).
1o Se considera: , distributia empirica de selectie , functia de repartitie , ;
2o Se calculeaza astfel incat ;
30 Se calculeaza , unde ;
4o Concluzii: daca , ipoteza nula este admisa, in caz contrar ipoteza este respinsa.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 3002
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved