CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
INFERENTA STATISTICA
1. Inferenta adevarurilor stiintifice: teste de semnificatie
Cunoasterea umana se imbunatateste continuu; cercetatorii stiintifici dobandesc cu fiecare zi ce trece noi cunostinte. Care le sunt metodele?
Atunci cand apare un fenomen nou, oamenii rationali incearca sa-i detecteze cauzele, si avanseaza diverse ipoteze care li se par plauzibile. Ulterior, in urma observarii altor aparitii ale fenomenului, unor ipoteze le creste, altora le scade veridicitatea, fiind posibil chiar sa se renunte la ele; intr-un cuvant, plauzibilitatea fiecarei ipoteze "explicative" este reevaluata.
Testarea statistica de semnificatie este o metoda de stabilire a gradului de plauzibilitate
(veridicitate). Particularitatea sa este limpede: se refera la un anumit tip special de
ipoteze, cunoscute sub numele de ipoteze statistice. Intr-o abordare de bun simt, a testa o anumita presupunere (adica o ipoteza) careia experienta noastra personala ne spune sa-i acordam crezare, este usor de explicat:
Trebuie sa subliniem aici cat de vagi sunt afirmatiile din paragraful precedent: intelesul precis al sintagmei "suficient de bine" este lasat la latitudinea cititorului. La fel
si responsabilitatea oricarei consecinte neplacute pe care ar putea-o avea o deciziegresita.
Evident, ipotezele avansate de catre cercetatorii stiintifici sunt cunoscute ca ipoteze stiintifice. Efectuarea unui test de semnificatie, cunoscuta si sub numele de testarea sau verificarea ipotezelor, este o metoda folosita pentru a testa o presupunere, in care credem, despre o intreaga populatie, prin folosirea datelor obtinute dintr-un esantion. In general, rezultatul unui test de semnificatie este exprimat printr-un numar. Acest numar reflecta cat de plauzibila este ideea ca valoarea unei anumite statistici descriptive - care este calculata din datele obtinute din acel esantion - ar putea proveni dintr-un esantion aleator.
Abordarea initiala a lui Robert A. Fisher (publicata in cartea Statistical Methods for Research Workers in anul 1925) a fost dedicata cercetatorilor stiintifici: validitatea unei ipoteze stiintifice este stabilita pe baza unui singur test, cu optiunea de a nu emite o
judecata definitiva atunci cand rezultatul nu este "suficient de limpede". In aceasta abordare sunt posibile doar doua optiuni:
De regula, oamenii care iau decizii (agentii decizionali) le iau bazandu-se pe informatii partiale, limitate si de aceea deciziile pot fi mai mult sau mai putin corecte sau eficiente. Un om rational incearca sa minimizeze costul deciziilor gresite. Abordarea sa, atunci cand este confruntat cu alegerea intre doua ipoteze aflate in competitie, este clara: va alege una, iar decizia de alegere va fi luata pe baza informatiilor obtinute anterior din esantioane.
Fie in postura de cercetator stiintific, fie in cea de agent decizional, vom fi in masura
de a lua decizii rationale - in urma efectuarii unui test de semnificatie - doar atunci cand
vom intelege pe deplin esenta acestor teste. Aceasta implica doua aspecte:
1) Pe de o parte, va trebui sa intelegem la ce tip de probleme testele de semnificatie
ofera (cel putin partial) raspunsuri, iar
2) Pe de alta parte, va trebui sa intelegem natura informatiilor pe care ni le ofera aceste
teste.
Din punctul de vedere al intelegerii lumii inconjuratoare, dar si din punctul de vedere al logicii, abordarea lui Fisher este usor de explicat: ipotezele stiintifice se refera la populatii teoretice, care au de obicei un numar infinit de indivizi si sunt reprezentate de
distributii continue. O ipoteza stiintifica este inlocuita printr-o ipoteza statistica, exprimata prin intermediul parametrului acelei populatii (cum ar fi proportia, media etc.).
Valoarea parametrului este estimata prin exploatarea datelor obtinute dintr-un esantion
extras din populatie, apoi este comparata cu o valoare "asteptata". Discrepanta dintre cele
doua va influenta "credinta" noastra in validitatea ipotezei stiintifice.
Ipoteza statistica asociata ipotezei stiintifice este bazata, astfel, pe un esantion "mic" extras dintr-o populatie finita (posibil "mare"). O prima eroare ce poate fi facuta isi are originea in identificarea ipotezei stiintifice cu cea statistica asociata. Totusi, atunci cand folosim metodele statisticii, identificam de fapt aceste doua ipoteze si incercam sa
evaluam riscul erorilor pe care le-am putea face.
Pe scurt, ideea testarii ipotezelor (adica a testelor de semnificatie) este simpla: ipoteza statistica va servi ca alternativa la o alta ipoteza - asa-numita "ipoteza nula" - care este luata in considerare doar pentru a fi respinsa. Prin acceptarea adevarului ipotezei nule vor rezulta anumite consecinte statistice, iar acestea vor fi confruntate cu datele observate. Orice dovada aflata in contradictie cu ipoteza nula va servi ca justificare a alternativei.
2. Relatia intre ipoteza alternativa si ipoteza nula in testarea ipotezelor
Am afirmat anterior ca o ipoteza statistica este o afirmatie despre un parametru al
populatiei (sau despre mai multi parametri ai populatiei/populatiilor). O asemenea
afirmatie este legata de ipoteza stiintifica luata in considerare (sau este o consecinta
logica a ipotezei stiintifice).
Sa prezentam, in continuare, prin cateva exemple felul in care se relationeaza cele doua tipuri de ipoteze. Anume, sa consideram urmatoarele afirmatii:
(1) La varsta de 10 ani, fetele sunt mai inteligente decat baietii,
(2) Varsta "foarte inaintata" este un predictor semnificativ al maladiei Alzheimer,
(3) Copiii sunt mai creativi decat adultii,
(4) Medicamentul A ajuta pacientii sa se insanatoseasca mai bine decat medicamentul B,
(5) Inginerii barbati si femei au salarizari diferite,
(6) Pacientii isi revin in urma unui tratament standard,
(7) Cei ce urmeaza dieta saptamanala prescrisa de faimosul dietetician Dr. C vor pierde
in greutate exact 2 kg,
(8) Medicamentul D nu are nici un efect asupra tuberculozei,
(9) Efectele medicamentului E asupra bolnavilor barbati si femei sunt similare.
Recunoastem in cele noua afirmatii de mai sus enunturi ale "credintelor" specialistilor si profesionistilor, rezultate din lunga lor experienta personala.
Se poate observa o distinctie clara intre primele sase si ultimele trei: acestea din urma
exprima o egalitate, o similaritate sau o coincidenta (sa observam ca "nu are efect"
inseamna "nu schimba cu nimic situatia", sau ca "situatia de dinaintea tratamentului cu
medicament este aceeasi cu situatia de dinainte"). Din contra, primele sase afirmatii
exprima o inegalitate, o disimilaritate sau o diferenta.
Aceasta distinctie este esentiala pentru posibilitatea aplicarii testarii ipotezelor. Este esential sa subliniem ca testarea statistica de semnificatie poate fi aplicata doar ipotezelor stiintifice care sunt exprimate ca inegalitati, disimilaritati sau diferente; in niciun caz egalitati cum este cea din (7) nu pot fi confirmate ca "adevarate" prin testare statistica de semnificatie. Probabil ca ceea ce specialistul nostru (sa fie oare aceste Dr. C?) vroia sa exprime era urmatoarea afirmatie:
(7') Cei ce urmeaza dieta saptamanala prescrisa de faimosul dietetician Dr. C vor
pierde in greutate cel putin 2 kg, iar in aceasta forma ea ar putea servi ca punct de plecare pentru o testare statistica de semnificatie.
Sa inlocuim cele sapte ipoteze stiintifice (1)-(6) si (7') de mai sus prin ipotezele
statistice corespunzatoare. Va trebui sa implicam unii parametri ai populatiilor respective:
(1a) IQ-ul mediu al fetelor in varsta de 10 ani este mai mare decat IQ-ul mediu al
baietilor in varsta de 10 ani,
(2a) Incidenta maladiei Alzheimer este mai mare la persoanele de varsta foarte
inaintata (prin comparatie cu persoanele de varsta inaintata),
(3a) Indicele mediu de creativitate al copiilor este mai mare decat cel al adultilor,
(4a) Proportia pacientilor insanatositi dintre cei tratati cu medicamentul A este mai
mare decat proportia corespunzatoare pentru medicamentul B,
(5a) Salariul mediu al medicilor barbati difera (este mai mare?) decat salariul mediu al
medicilor femei,
(6a) Starea medie de sanatate a pacientilor, in urma unui tratament standard, este mai
buna decat inaintea inceperii tratamentului,
(7a) Scaderea medie in greutate a persoanelor ce urmeaza dieta saptamanala prescrisa
de faimosul dietetician Dr. C este de cel putin 2 kg.
Toate aceste afirmatii vor putea servi ca ipoteze alternative in testari de semnificatie. In general, intr-o testate statistica de semnificatie, ipoteza alternativa este o afirmatie despre parametrii unei/unor populatii, care inlocuieste ipoteza stiintifica (presupusa plauzibila). (Sa facem observatia ca in toate exemplele de mai sus, ca parametri ai populatiilor au fost considerati medii sau proportii.)
Se obisnuieste sa fie numita ipoteza alternativa si sa fie notata cu Ha (sau H1) tocmai ipoteza stiintifica luata in considerare, ca afirmatie exprimand o inegalitate, o
disimilaritate sau o diferenta.
Din punct de vedere logic, in aceiasi termeni am putea enunta si o alta afirmatie, de data aceasta exprimand egalitatea sau inegalitatea inversa, similaritatea sau coincidenta. Aceasta afirmatie este notata cu H0 si este numita ipoteza nula. Conform lui R. A. Fisher, ipoteza nula este "ridicata" - ca un complement al ipotezei alternative - doar pentru a fi respinsa, iar prin respingerea ei vom accepta ca "adevarata" ipoteza stiintifica initiala.
Sa prezentam aceste afirmatii pentru cele sapte exemple de mai sus:
(1-H0) IQ-ul mediu al fetelor in varsta de 10 ani este egal cu IQ-ul mediu al baietilor in
varsta de 10 ani,
(2-H0) Incidenta maladiei Alzheimer la persoanele de varsta foarte inaintata este aceeasi
cu cea la persoanele de varsta inaintata,
(3-H0) Indicele mediu de creativitate al copiilor este egal cu cel al adultilor,
(4-H0) Proportia pacientilor insanatositi dintre cei tratati cu medicamentul A este egala cu
cea corespunzatoare pentru medicamentul B,
(5-H0) Salariul mediu al medicilor barbati este egal cu salariul mediu al medicilor femei,
(6-H0) Starea medie de sanatate a pacientilor, in urma unui tratament standard, nu sufera
nicio schimbare,
(7-H0) Scaderea medie in greutate a persoanelor ce urmeaza dieta saptamanala prescrisa
de faimosul dietetician Dr. C este de exact 2 kg.
R. A. Fisher a dat numele de "ipoteza nula" deoarece aceasta ipoteza ar trebui sa fie"anulata". Acest nume a fost retinut si a supravietuit probabil datorita faptului ca in multecazuri ipoteza nula poate fi scrisa sub forma unei "egalitati cu zero":
(H0) f (p) = 0 in care f este o functie de parametrii p ai populatiilor implicate in testare. Poate ca cel mai bun exemplu este urmatorul:
(10) m f - mb = 0
in care parametrii m f si mb reprezinta IQ-ul mediu al fetelor, respectiv baietilor in varsta
de 10 ani.
Exista intotdeauna posibilitatea ca ipoteza nula sa fie ea cea adevarata, deci prin
respingerea ei sa facem o eroare. Admitand ca dispunem de informatii complete despre distributia populatiei, singura sursa de eroare ar ramane maniera in care sunt alesi indivizii din esantion. Atunci cand esantionul este ales aleator, diferentele dintre ceea ce ne asteptam si ceea ce constatam vor putea fi explicate doar prin factorul "sansa". Vom putea impune un prag asupra acestor diferente, separand diferentele "mici", acceptabile, de cele "mari", inacceptabile.
Acest prag este identificat odata cu specificarea nivelului de semnificatie.
3. SARCINI SAU PROBLEME DE COMPARATIE
In chip frecvent intervin in cercetarile psihologice probleme de comparatie. Astfel, se compara intre ele mediile obtinute intr-o experienta si se pune intrebarea daca diferentele constatate sunt semnificative sau nu, se pot extinde la populatie sau nu.
Exemplu (dupa I. Radu):
Intr-o experianta de instruire programata au fost cuprinse doua clase paralele. La probele de control date in post- test s-a constatat la clasa experimentala - cu un efectiv de 33 elevi - o medie a notelor de 7,7, iar in clasa de control (N = 34), media la aceleasi teste a fost de 6,7. Diferenta dintre medii este 1,00. Se pune intrebarea daca aceasta diferenta este semnificativa, daca putem extrapola la populatie, ceea ce ne indica daca metoda de instruire incercata este mai buna decat cele curente.
Rezultatele unei investigatii pot sa apara exprimate si sub forma de frecvente sau proportii. In exemplul citat mai sus rezultatele experimentului ar putea fi exprimate si in frecvente, indicand proportiile consemnate de raspunsuri corecte si de raspunsuri gresite. Si in cazul acesta se pune intrebarea daca diferentele constatate sunt semnificative sau nu. Raspunsul la intrebarea pusa s-ar putea obtine repetand experienta. Daca rezultatele se mentin statornice vom putea conchide asupra semnificatiei lor. Cum experientele nu se pot repeta indefinit - procedeu de altfel neeconomic - s-a conturat un mecanism logic prin care se infirma ipoteza hazardului, notata H0.
In conditiile experientei obisnuite ne-am putea multumi cu diferente intre medii de 0,5 sau 0,7 ori 0,9 s.a.m.d., dupa cum diferente de 5%, 7% etc intre frecvente ar parea doveditoare.
Experimentul stiintific nu poate face extrapolari la populatie bazate doar pe simpla evaluare intuitiva. Intrebarea este: de la ce nivel (0,5 sau 0,7, respectiv 5%; 7%;) diferentele pot fi considerate semnificative?
In orice experienta studiem procesul dat in anumite conditii, intr-un anumit context: la lectie, la joc, in activitatile practice, in conditii de laborator etc. Trebuie sa admitem ca, intr-un fel sau altul, intamplarea poate interveni in desfasurarea fenomenului cercetat prin conditii neasteptate, prin compozitia grupului, prin deosebiri in personalitatea profesorului etc. Datele obtinute sunt afectate in felul acesta de un element aleator (intamplator).
In consecinta, alaturi de ipoteza specifica (Hs), ce sta la baza experientei respective si care este o ipoteza psihologica sau pedagogica se poate formula si o alta ipoteza care sa atribuie numai intamplarii tendintele sau diferentele constatate. Aceasta din urma este 'ipoteza intaplarii'sau ipoteza nula (H0) si se enunta pentru toate cazurile in aceiasi termeni. De notat ca atat ipoteza nula (H0) cat si ipoteza alternativa (Hs) se refera la populatie, nu la esantioane ca atare.
Preocupat sa dovedeasca in mod temeinic justetea ipotezei specifice, cercetatorul va admite in mod provizoriu -in rationamentul sau - ipoteza nula si va determina sansele (probabilitatea) ca diferentele obtinute in experiment sa aiba loc numai pe baza ' legilor intamplarii' (care sunt legi de probabilitate bine studiate). Stim ca probabilitatea ia valori intre 0 si 1, iar transcrisa in procente - intre 0 si 100%.
Daca probabilitatea obtinerii diferentei date, in baza ipotezei nule, este foarte mica (de pilda, mai mica decat 0,05 ceea ce se scrie p < 0,05), atunci respingem ipoteza hazardului si aratam toata increderea ipotezei specifice. Daca insa, probabilitatea determinata in lumina ipotezei nule este mai mare (de pilda, p > 0,10 putand merge pana la 1), atunci nu ne putem asuma riscul respingerii ipotezei nule si vom considera diferentele efectiv obtinute ca fiind inca nesemnificative.
Prin urmare se accepta ca semnificative acele rezultate care au sansele de a se produce prin simpla intamplare numai intr-un numar mic de cazuri: sub 5% din cazuri, uneori sub 10%. Sansele de a obtine rezultatele respective prin simplul joc al factorilor aleatori se afla in acest caz sub 10%, respectiv 5% ( ceea ce se scrie p < 0,10 respectiv p < 0,05). Inseamna ca, acceptand rezultatele unei experiente drept proba justetei ipotezei specifice, ne asumam totodata riscul de a gresi in mai putin de 10%, respectiv 5% din cazuri. Fiecarei asertiuni i se asociaza astfel un prag de semnificatie, care indica riscul de a gresi pe care ni-l asumam.
Rezumand: mecanismul logic al ipotezei nule permite infimarea ipotezei hazardului si acceptarea in consecinta a ipotezei alternative (Hs). Ipoteza nula si ipoteza alternativa sunt contradictorii; a respinge ipoteza nula inseamna a accepta ipoteza specifica. Daca plasam pe o axa probabilitatile amintite vom avea situatia din figura 3.
1 0,05 0,01 0
|----- ----- ---------- . . . ----- ----- -------|----- ----- --------|----- ----- -------->
H0 nu se considera infirmata H0 se considera infirmata
si se suspenda decizia si se accepta Hs
Fig. 3 Limita semnificativitatii statistice (prag de semnificatie)
Respingand ipoteza nula si accepand existenta unui efect al variabilei independente - ceea ce sustine Hs - ne asumam un risc de a gresi destul de mic: 5% respectiv 1%. Masurarea acestui risc, notata cu , constituie pragul de semnificatie, care insoteste fiecare asertiune.
Se poate intapla ca ipoteza nula sa nu fie infirmata, z cal fiind mai mic decat 1,96 (deci p > 0,05). In cazul acesta nu se conchide ca H0 ar fi validata, ci, pur si simplu, ca nu se poate decide; intervine o zona de suspendare a judecatii. Valoarea | z | care separa cele doua zone - zona de respingere a ipotezei nule si zona de suspendare a judecatii - se numeste valoare critica. Ea corespunde valorii z cal avand o probanbilitate asociata egala cu . Riscul de a gresi se poate lua 10%, 5%, 1%. Traditia a acreditat pragul de p≤ 0,05 sau p≤ 0, 01. In functie de cerintele cercetarii se alege pragul indicat.
De notat ca ipoteza nula nu poate fi niciodata acceptata; a nu se respinge H0 nu echivaleaza cu acceptarea ei. In schimb, ipoteza specifica nu poate fi niciodata respinsa. Fiind o ipoteza statistica imprecisa nu se poate calcula distributia de esantionaj sub ipoteza alternativa (Abdi, 1987).
Valorile cririce ale criteriului z, t, s.a. au fost calculate pentru diferite praguri a fiind prezentate sub forma de tabele ce urmeaza doar a fi consultate. Regula de decizie este precizata:
- daca criteriul z, calculat pe esantionul experimental este mai mare sau egal cu valoarea critica (z critic), probabilitatea sa asociata este mai mica sau egala cu pragul (se decide respingerea H0);
- daca criteriul z cal, calculat pe esantionul experimental, este mai mic decat valoarea critica (z critic), probabilitatea asociata este mai mare decat pragul . In consecinta intervine suspendarea judecatii: nu se va respinge nici accepta H0. In sens strict, se va decide de a nu se decide (Abdi, 1987).
In probleme de comparatie statistica urmeaza sa se faca distictia intre esantioane independente si esantioane perechi.
O clasa de elevi, spre exemplu, poate fi considerata practic ca un esantion la intamplare extras dintr-o colectivitate mai larga. Daca se considera o alta clasa, paralela, in vederea unei experiente determinate, atunci alegerea poate fi facuta in doua feluri. Se pot alege in mod independent cele doua esantioane: faptul ca un element sau altul din primul esantion a fost ales nu are nici o influenta asupra alegerii elementelor din esantionul al doilea. Compozitia celor doua grupe nu este reglementata pe baza unei probe prealabile; cele doua clase sunt considerate in compozitia lor stabilita prin ' legile intamplarii'. In acest caz este vorba despre esantioane independente.
Se poate proceda si altfel. Se pot constitui esantioane perechi. In cazul acesta, fiecare element dintr-un esantion corespunde unui element dintr-un alt esantion (formeaza o pereche cu el). De exemplu, pentru a compara doua metode de instruire se constituie doua grupe cu acelasi numar de elevi, astfel ca fiecarui elev dintr-o grupa sa-i corespunda un elev din cealalta grupa, avand acelasi nivel de cunostinte, eventual acelasi C.I. In felul acesta, compozitia grupelor este precizata pe baza unei probe anterioare, in virtutea careia elementele celor doua esantioane nu se determina la intamplare. Fiecare individ dintr-o grupa are 'corespondent" in grupa a doua, avand aceeasi nota (sau acelasi nivel) in proba preliminara. Situatia este identica si in cazul cand acelasi grup de subiecti este supus de doua ori la probe diferite (de exemplu, inainte si dupa actiunea unui anumit factor experimental). Se obtin atunci doua grupe de masurari efectuate pe aceiasi subiecti, care constituie perechi.
Prin urmare putem alege grupele de studiu in mod independent si atunci este vorba de o alegere la intamplare a elementelor; sau putem asocia intr-un anumit fel - pe baza unui criteriu precis - elementele celor doua esantioane, doua cate doua, si atunci compozitia lor este determinata de regula in virtutea unei probe prealabile: test de inteligenta, test de cunostinte etc.
3.1. Semnificatia diferentei intre doua medii in cazul
esantioanelor independente
Probele de semnificatie difera in functie de doua situatii:
●cand numarul de masuratori (N) in fiecare esantion este destul de mare (mai mare ca 30);
●cand numarul de masurari sau volumul esantionului este mai mic dacat 30.
In experimentele cu caracter instructiv de la care am pornit N1= 33 si N2 = 34, deci ne aflam in prima situatie.
Pentru a vedea daca cele doua medii constatate difera semnificativ, facem rationamentul care urmeaza.
Admitem pentru moment ipoteza nula si stabilim care este sansa de a fi verificata. Cu alte cuvinte presupunem ca diferenta intre cele doua medii si se datoreste intamplarii si ca nu exista diferente reale intre esantioanele considerate. In limbaj statistic inseamna ca cele doua grupe constituie esantioane extrase la intamplare din aceeasi populatie.
Pentru a testa ipoteza nula se utilizeaza criteriul sau raportul:
in care notatiile sunt deja cunoscute.
Calculand valoarea raportului de mai sus, notat cu | z |, ne vom referi la proprietatile curbei normale schitand valorile calculate (z cal) in raport cu valorile critice (1,96 si 2,58). Daca valoarea ce va corespunde indicelui z cal este mai mare decat 1,96, atunci diferenta intre cele doua medii este semnificativa la pragul de p < 0,05, iar daca z cal > 2,58, atunci diferenta este semnificativa la pragul de p < 0,01. Bineinteles, daca vom avea z cal < 1,96, atunci ipoteza nula nu va fi infirmata, iar diferenta obtinuta in cadrul experientei nu va fi considerata concludenta pentru a proba justetea ipotezei specifice (vom suspenda decizia).
In exemplul considerat trebuie sa cunoastem cu privire la fiecare grup , N si .
Utilizand formula stabilita obtinem:
.
Raportul gasit este mai are decat 1 si mai mic decat 2,58, deci p < 0,05. Facand un calcul de interpolare se afla p = 0 ; deci diferenta este net semnificativa, ipoteza nula fiind infirmata.
Cand volumul datelor obtinute in fiecare esantion este mai mic (numarul de masurari este mai mic decat 30) se utilizeaza un procedeu intrucatva diferit.
Ipoteza nula se enunta la fel: presupunem ca cele doua grupe de date sunt doua esantioane intamplatoare ce provin din aceesi colectivitate generala. Verificam apoi sansa acestei ipoteze pe baza criteriului t:
.
Pentru a obtine o estimare a dispersiei colectivitatii - care este notata in formula cu s2 - se combina datele celor doua esantioane:
Formulele de la numarator ne sunt cunoscute de la calcularea dispersiei (sumei de patrate referitoare la cele doua grupe), iar N1 si N2 sunt efectivele celor doua esantioane.
Exista un tabel special (intocmit de Student) in care figureaza probabilitatile raportului | t | corespunzator numarului 'gradelor de libertate' care depinde de volumul esantioanelor (vezi Anexa 1.1.). In cazul nostru numarul acesta - notat n - este:
n = N1 + N2 - 2.
Sa luam un exemplu.
In procesul invatarii esalonarea repetitiilor este mai productiva decat concentrarea lor. Intr-o experienta se ia cate o grupa formata fiecare din cate 10 subiecti si se experimenteaza in cele doua situatii prevazute: repetitii esalonate sau concentrate in timp. Inca din prima perioada subiectii manifesta o diferenta. Vrem sa stim daca ea este semnificativa (dupa P. Oleron).
Datele consemnate de autor sunt:
| t | fiind calculat, ne referim la tabelul distributiei | t | intocmit de Student. Acest tabel prezinta o coloana n sau v, care corespunde gradelor de libertate. In tabelul de mai sus n = 10 +10 - 2 = 18. Cautam in coloana n pe 18. Dupa ce l-am fixat, mergem pe randul respectiv si cautam valoarea lui | t | la pragul de 0,05 si 0,01 (probabilitatea o citim in prima linie de sus a tabelului unde gasim de la dreapta spre stanga: 0,01; 0,02; 0,05; 0,10). In cazul nostru tabelul indica 2,10 pentru | t | la pragul de 0,05 respectiv 2,88 la oragul de 0,01. Valoarea calculata in exemplul ales este 0,63, deci este mult mai mica decat 2,10 careia ii corespunde p = 0,05. Putem spune atunci ca pentru | t | = 0,63 avem p > 0,05. si astfel ipoteza nula nu este infirmata. Consideram diferenta dintre medii ca nesemnificativa, mai exact suspendam decizia.
In general, daca valoarea gasita prin calcul este mai mica decat valoarea | t | indicata in tabel la pragul p = 0,05, atunci consideram ca ipoteza nula nu este infirmata, iar diferentele obtinute in experienta ca nesemnificative. Daca valoarea calculata de noi este mai mare decat valoarea | t | la pragul 0,05, dar mai mica dacat valoarea lui | t | la pragul de 0,01, vom spune ca diferenta este semnificativa la pragul de 0.05. In sfarsit, daca valoarea gasita de noi este mai mare decat valoarea | t | indicata in tabel pentru
p = 0,01, atunci vom spune ca diferenta este semnificativa la pragul de 0,01.
Observam ca respingerea ipotezei nule se face considerand un prag de semnificatie ales in prealabil (cel mai riguros este p = 0,01). De retinut este faptul ca ipoteza nula nu se considera niciodata demonstrata; ea poate fi doar infirmata. Efectul admiterii sau respingerii ipotezei nule se rasfrange asupra ipotezei specifice. Neinfirmarea ipotezei nule pune sub semnul intrebarii ipoteza specifica, infirmarea ipotezei nule consolideaza foarte mult ipoteza specifica. Cele doua ipoteze H0 si Hs sunt, cum s-a spus, contradictorii.
3.2. Semnificatia diferentei intre doua medii in cazul
esantioanelor perechi
Cand elementele celor doua esantioane sunt asociate intr-un anumit mod doua cate doua (de exemplu, rezultatele inregistrate inainte si dupa actiunea unui factor experimental), procedeul cel mai simplu consta in a rationa asupra diferentelor pe care le prezinta fiecare pereche de date asociate, corelate.
Sa notam cu x rezultatele din primul grup de masurari (esantion) si cu x' valorile asociate din esantionul al doilea. Diferenta corespunzatoare fiecarei perechi de note x - x' o insemnam cu d. Se obtin astfel patru coloane.
Exemplu
Cu o grupa de 10 elevi s-a incercat la geografie, in decursul trimestrului II al anului scolar, o metoda noua de invatare individuala, pe baza unor intrebari de control fixate pe cartonase. S-au inregistrat notele elevilor la geografie la inceputul experientei, adica la sfarsitul trimestrului I si apoi la incheierea trimestrului II. Vrem sa stim daca metoda respectiva aduce o imbunatatire semnificativa a situatiei scolare.
Pentru a determina acest lucru intocmim un tabel in care vom inscrie subiectii, rezultatele obtinute in cele doua situatii si vom calcula diferentele dintre ele (Tab.1.).
Se observa din tabel ca avem diferente nule, pozitive si negative.
Formulam ipoteza nula, adica atribuim numai intamplarii diferentele constatate, Daca s-ar datora numai intamplarii, aceste diferente ar fluctua in jurul lui 0 intr-un sens sau altul, iar media lor ar fi egala cu zero md= 0 (cu md am notat media diferentelor).
Tabelul 1
Subiecti |
Note trim. II x` |
Note trim. I x |
d |
d2 |
A | ||||
B | ||||
C | ||||
D | ||||
E | ||||
F | ||||
G | ||||
H | ||||
I | ||||
K | ||||
N |
d |
d2 |
Vom insuma algebric coloana d (tinand deci seama de semne) si vom afla
∑d = T. Apoi, facand raportul T/N, vom afla media diferentelor md.
In exemplul ales, md = T/N = 0,09, deci md difera de zero; nu stim daca diferenta aceasta este suficient de mare pentru a putea fi considerata semnificativa sau nu.
Se utilizeaza criteriul:
in care cunoastem si N, dar nu cunoastem (abaterea standard a diferentelor).
Tratam diferentele asa cum am considerat inainte datele brute.
Calculam mai intai dispersia diferentelor:
si
In exemplul ales adaugam in tabel o coloana d2, pe care insumand-o obtinem Σd2=27.
Facand inlocuirile:
de unde
Deci
Cautam in Anexa 1.1. | t | tinand seama de faptul ca in acest caz numarul gradelor de libertate este N - 1 (si nu N1+N2- 2, ca in primul caz).
In exemplul de mai sus, N - 1 = 9. Cautand in tabel gasim pentu 9 grade de libertae,la pragul de p = 0,05 cifra 2,26. Valoarea calculata de noi este inferioara acestei cifre. Inseamna ca nu s-a demnostrat falsitatea ipotezei nule si, in felul acesta nu se poate spune ca rezultatele experientei sunt semnificative.
Cand N este destul de mare (>60) putem raporta valoarea gasita prin calcul la valorile z (1,96 si 2,58) fara sa mai facem apel la Tabelul lui Student.
Trebuie reamintit in incheiere ca atat raportul | z | cat si criteriul | t | presupun drept conditie aspectul normal al distributiilor supuse comparatiei.
Sumar
Abdi H. (1987). Introduction ou traitemant statistique des donnes exprimentale, Grenoble:
Presses Universitaire de Grenoble.
Faverge, J.M. (1965). Mthodes statistiques en psychologie applique. t.III, Paris, P.U.F.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole Publishing Company, Pacific Grove.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New York, Appleton
ATENTIE
Pentru conditia de estimare sau de comparare a doua medii se cere:
EX : Pentru verificarea ipotezei "Exista diferente intre adolescenti si adolescente cu privire la nivelul autoevaluat al stimei de sine (total si pe subfactori) s-a utilizat testul
t (Student) pentru esantioane independente.
Tabelul 1. Compararea nivelului stimei de sine (totale si pe subfactori) intre adolescenti si adolescente
STIMA DE SINE |
Sex |
N |
m |
σ |
t (174) |
p |
Sine fizic |
Fete |
113 |
7,65 |
2,21 |
-4,372 |
0,000 |
Baieti |
63 |
9,10 |
1,92 |
|||
Sine emotional |
113 |
7,70 |
2,42 |
-2,974 |
0,003 |
|
Baieti |
63 |
8,81 |
2,28 |
|||
Sine scolar |
Fete |
113 |
6,82 |
2,45 |
-0,396 |
0,693 |
Baieti |
63 |
6,97 |
2,10 |
|||
Sine social |
Fete |
113 |
9,19 |
1,93 |
0,651 |
0,516 |
Baieti |
63 |
8,95 |
2,17 |
|||
Sine prospectiv |
Fete |
113 |
8,21 |
1,61 |
1,755 |
0,081 |
Baieti |
63 |
7,73 |
1,98 |
|||
Sine total global |
Fete |
113 |
39,65 |
7,15 |
-1,727 | |
Baieti |
63 |
41,59 |
7,06 |
Inspectarea tabelului 1 ne atrage atentia ca in cazul stimei de sine globale rezultatul obtinut este t (174) =1,727 la un prag de semnificatie p=0,086 > 0 ceea ce conduce la concluzia ca nu exista diferente intre adolescenti si adolescente cu privire la nivelul autoevaluat al stimei de sine totale. Desi valoarea calculata este > 0 , totusi ea se gaseste la limita semnificatiei statistice, care poate avea insa valente psihologice diferite dup[ continuturile evaluate de scala stimei de sine (emotional, scolar, social, prospectiv).
Nu putem spune ca fetele sau baietii prezinta diferente privind stima de sine autoevaluata, putem doar spune ca fiecare dintre ei pun accentul pe altceva, au alte valori, mentalitati si aspiratii, in asa fel incat stima de sine este modelata de aspecte diferite pentru fete fata baieti. Totusi analiza tabelului indica faptul ca aparenta omogenizare a rezultatelor cu privire la nivelul sinelui global se particularizeaza diferit pe sexe prin sursele sinelui, pe care chestionarul le evalueaza. Astfel, factorii care evidentiaza diferente semnificative pe sexe sunt urmatorii:
In cazul subfactorului "sine fizic" rezultatul obtinut este t(174) = -372 la un prag de semnificatie p=0,000, deci exista diferente intre adolescenti si adolescente, in favoarea baietilor cu privire la nivelul autoevaluat al stimei de sine fizice. Aceasta situatie poate fi explicata prin autoaprecierea favorabila a atributelor fizice de catre baieti, fata de fete. Ar putea fi explicata aceasta depreciere a stimei de sine fizice a fetelor fata de baieti prin discordante intre perceptia sinelui fizic a tinerelor fete, fata de presiunea sociala a tipului fizic al femeii de succes.
Se continua analiza diferentelor semnificative la subfactorul sine emotional.
ANEXA 1.1.
Distributia t
P n | ||||
|
||||
|
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 1230
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved