CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
Testul t pentru diferenta dintre mediile a doua esantioane dependente
Testele de comparatie prezentate pana aici (t pentru esantioane independente si ANOVA) au vizat situatii in care mediile comparate apartineau unor grupuri compuse din subiecti diferiti (motiv pentru care sunt denumite ca "independente", sau "necorelate"). Din cauza ca acest model de cercetare presupune comparatii intre subiecti, el se mai numeste si model intersubiect (between subject design).
Un alt model uzual in cercetarea psihologica vizeaza comparatia a doua (sau mai multe) valori masurate pe aceiasi subiecti. Iata cateva ilustrari tipice:
a)Situatia in care o anumita caracteristica psihologica se masoara inaintea unei conditii si apoi, dupa actiunea acesteia. Exemple: (i) evaluarea nivelului anxietatii inainte si dupa un program de desensibilizare; (ii) evaluarea performantei cognitive a unui lot de subiecti, inainte si dupa procedura de ascensiune simulata in camera barometrica la 5000m; (iii) evaluarea timpului de reactie inainte si dupa ingerarea unei substante. Deoarece se bazeaza pe masurari repetate ale unei variabile pe aceiasi subiecti, acest model de cercetare este cunoscut ca "modelul masurarilor repetate" (repeated-measures design).
b)Situatia in care cercetatorul utilizeaza doua conditii de investigare, dar plaseaza aceiasi subiecti in ambele conditii. De exemplu, intr-un studiu asupra efectelor unui anumit tip de stimulare, se pot masura undele cerebrale, simultan in cele doua emisfere cerebrale. Fiind vorba despre masurarea unor variabile care sunt evaluate concomitent, la aceiasi subiecti, acesta este un model "intrasubiect" (within-subjects design).
c)Cazul in care natura situatiei experimentale nu permite utilizarea acelorasi subiecti pentru cele doua masurari, de exemplu, in contextul unei interventii terapeutice care are un efect pe termen foarte lung. In acest caz este se poate gasi pentru fiecare subiect corespunzator conditiei initiale un subiect "similar", corespunzator conditiei finale, constituind astfel "perechi de subiecti" apartinand fiecare unui grup distinct, intre care se poate face o comparatie directa. Ca urmare, desi diferiti, vom trata cei doi subiecti din pereche ca si cum ar fi aceeasi persoana. Sau, intr-un alt context, putem compara subiecti care sunt intr-un anumit tip de relatie, interesandu-ne diferenta dintre ei sub o anumita caracteristica. De exemplu, ne poate interesa daca intre nivelul de inteligenta dintre baietii si fetele care formeaza cupluri de prieteni exista o anumita diferenta. In acest caz, desi avem doua esantioane distincte, fiecarui subiect din esantionul de baieti ii corespunde un subiect din esantionul de fete, constituirea celor doua esantioane facandu-se pe baza relatiei de prietenie dintre ei. In aceeasi categorie se afla comparatiile intre perechi de gemeni, sau cele dintre soti. In astfel de cazuri, avem de a face cu asa numitul model al "esantioanelor perechi" (matched pairs design).
Indiferent de tipul lor, toate modele prezentate mai sus au un obiectiv similar, acela de a pune in evidenta in ce masura o anumita conditie (variabila independenta) corespunde unei modificari la nivelul unei caracteristici psihologice oarecare (variabila dependenta). Vom observa ca, in toate exemplele evocate, variabila independenta este
una de tip nominal, dihotomic (inainte/dupa; semestru/sesiune; grup de cercetare/grup de control; baiat/fata; sot/sotie, etc.), in timp ce variabila dependenta se masoara pe o scala cantitativa, de interval sau de raport. De asemenea, trebuie sa consemnam faptul ca in ambele situatii se utilizeaza masuratori de acelasi fel, cu acelasi instrument, care produce valori exprimate in aceeasi unitate de masura, intre care se poate efectua un calcul direct al diferentei.
Pentru descrierea testului statistic adecvat acestor cazuri sa ne imaginam urmatoarea situatie generica de cercetare: Un grup de pacienti cu tulburari de tip anxios sunt inclusi intr-un program de psihoterapie, avand drept scop ameliorarea nivelului anxietatii. Inainte de inceperea programului a fost aplicata o scala de evaluare a anxietatii. Acelasi instrument a fost aplicat din nou, dupa parcurgerea programului de terapie.
Aici s-ar putea pune intrebarea de ce nu consideram valorile rezultate din cele doua masuratori ca fiind independente, urmand sa utilizam testul t pentru acest tip de date? Exista mai multe argumente in favoarea respingerii acestei variante simplificatoare:
a)Utilizarea valorilor perechi ofera informatii mai bogate despre situatia de cercetare. In modele de cercetare de tip inainte/dupa ea capata chiar valente de experiment.
b)Testul t pentru esantioane independente surprinde variabilitatea dintre subiecti, in timp ce testul t pentru esantioane dependente (masurari repetate) se bazeaza pe variabilitatea "intra-subiect", aceea care provine din diferenta valorilor de la o masurare la alta, la nivelul fiecarui subiect in parte.
c)Daca exista o diferenta reala intre subiecti, atunci testul diferentei dintre valorile perechi are mai multe sanse sa o surprinda decat cel pentru valori independente (puterea unui model de cercetare intra-subiect este mai mare decat in modelul inter-subiecti).
Revenind la tema de cercetare pe care am enuntat-o mai sus, desi avem aceiasi subiecti, si in primul si in al doilea caz, ne vom raporta la aceasta situatie ca si cum ar fi doua esantioane. Unul, cel al subiectilor care "nu au urmat inca" un program de terapie, iar celalalt, al subiectilor care "au urmat" un astfel de program. Datorita faptului ca cele doua esantioane sunt formate din aceiasi subiecti, ele se numesc "dependente" sau "corelate".
In acest tip de studiu, obiectivul testului statistic este acela de a pune in evidenta semnificatia diferentei dintre mediile anxietatii in cele doua momente. Cea mai simpla procedura de calcul este metoda diferentei directe. Pentru aceasta, calculam diferentele fiecarei perechi de valori din cele doua distributii (X2-X1), obtinand astfel o distributie a diferentelor, pe care o vom nota cu D.
Logica ipotezei de nul
Daca programul de terapie ar fi total ineficient, trebuie sa presupunem ca diferentele pozitive le-ar echilibra pe cele negative ceea ce, la un numar mare de esantioane ipotetice (formate din acelati numar de subiecti), am obtine o medie a diferentelor egala cu 0. Ca urmare, ipoteza statistica presupune ca media diferentelor la
nivelul populatiei de nul este 0. Aceasta inseamna ca testul t trebuie sa
demonstreze ca media diferentelor masurate pe esantionul cercetarii este
suficient de departe de 0, pentru a respinge ipoteza de nul si a
accepta ipoteza cercetarii. De aici rezulta ca putem reduce metoda
de calcul la formula testului t pentru un singur esantion, pornind de la
formula cunoscuta
a testului t,
unde mD este media distributiei D (a diferentelor dintre cele doua masurari), D este
media populatiei de nul a diferentelor dintre esantioane de acelasi fel, iar seD este eroarea
standard a distributiei D (imprastierea distributiei D).
Exemplu analitic de calcul
Problema cercetarii: Se poate obtine o reducere a reactiilor anxioase prin aplicarea unei anumite proceduri de psihoterapie?
Ipoteza cercetarii (H1):
Pentru test bilateral → Programul de psihoterapie are un efect asupra anxietatii.
Pentru test unilateral → Programul de psihoterapie reduce intensitatea reactiilor de tip anxios.
Ipoteza de nul (H0):
Pentru test bilateral → Programul de psihoterapie nu are nici un efect asupra anxietatii.
Pentru test unilateral → Programul de psihoterapie nu reduce nivelul anxietatii.
Populatiile cercetarii:
Populatia 1 → Subiectii cu anxietate ridicata care nu au urmat un program de terapie
Populatia 2 → Subiectii cu anxietate ridicata care au urmat un program de terapie
Ipoteza cercetarii afirma ca ele sunt diferite (m1-m2≠0), in timp ce ipoteza de nul afirma ca ele sunt identice (m1-m2=0).
Esantion: Un singur grup de subiecti cu probleme anxioase (N=8) al carui nivel de anxietate este evaluat inainte si dupa programul de terapie.
Criteriile deciziei statistice
Alegem modul de testare a ipotezei, bilateral.
Fixam, conventional, nivelul α=0.01. Sa spunem ca preferam acest nivel deoarece costurile de implementare a programului sunt destul de mari, iar pacientii trebuie convinsi ca merita timpul si banii1.
Cautam t critic pentru α=0.01 in tabelul distributiei t pentru 7 grade de libertate (N-1). Tabelul ne da valorile pentru un test unilateral (in dreapta curbei). Pentru testul bilateral trebuie mai intai sa injumatatim valoarea aleasa pentru α (0.01/2=0.005). In continuare, cautam valoare aflata la intersectia coloanei gradelor de libertate (7) cu coloana lui α=0.005 si citim t critic= -3.49. Ii atribuim semnul minus, deoarece ne asteptam ca nivelul anxietatii sa scada dupa aplicarea programului de terapie.
Datele cercetarii: |
|
|
||||
Inainte de program (X1) |
Dupa program (X2) |
D (X2-X1) |
D-mD |
(D-mD) 2 |
||
| ||||||
ΣX |
Σ(D-mD)2=4 |
|||||
N | ||||||
∑X m= N |
mD=-0,5 | |||||
SD=(D-mD)2 /N-1 |
SD= |
Nota: In principiu, sub aspectul procedurii statistice, nu prezinta nici o importanta daca utilizam diferenta X1-X2 sau X2-X1. Ordinea depinde de ceea ce doreste sa scoata in evidenta cercetatorul. Important este ca, in final, sa interpreteze corect rezultatul obtinut, in functie de semnul diferentei si semnificatia concreta a acestuia.
Introducem valorile in formula 3.24 si obtinem:
Rationamentul decizional
Comparam t calculat cu t critic pentru α=0.01 bilateral: -2,08 < -3.49
Decizia statistica: "acceptam ipoteza de nul". Probabilitatea de a se obtine un nivel al anxietatii mai redus doar ca urmare a jocului hazardului, este mai mare decat nivelul alfa pe care ni l-am impus drept criteriu de decizie (adica mai mic de 1%).
Decizia cercetarii: "datele nu sprijina ipoteza cercetarii". Ca urmare, nu putem accepta ca efectul obtinut se datoreaza programului de terapie. Programul de terapie nu reduce in mod semnificativ nivelul anxietatii.
Marimea efectului
Indicele de marime
a efectului (d - Cohen) pentru diferenta dintre medii dependente se calculeaza
cu formula lui Cohen:
Valoarea obtinuta indica o diferenta "medie-mare" sau "relativ importanta" intre mediile comparate (semnul lui d nu are relevanta). Asa cum se vede, este posibil sa obtinem un indice al marimii efectului "mediu spre ridicat" in conditiile unui rezultat nesemnificativ statistic. Acest lucru trebuie sa ne atraga odata in plus atentia asupra faptului ca cele doua proceduri (testul statistic si marimea efectului) vizeaza aspecte diferite. Pentru exemplul nostru, vom concluziona ca efectul terapiei este relativ important, dar nu are o putere suficienta penmtru a atinge pragul de semnificatie pe un lot de numai 8 subiecti. Este mai mult decat probabil ca pe un esantion mai mare rezultatul ar atinge si pragul de semnificatie statistica.
Limitele de incredere pentru diferenta dintre medii
La fel ca si in cazul testului t pentru esantioane independente, se pune problema generalizarii rezultatului la nivelul populatiei, cu alte cuvinte, care este intervalul in care ne putem astepta sa se afle diferenta dintre medii, pentru variabilele studiate. Pentru o estimare cu o precizie de 99%, conform cu nivelul alfa ales, limitele critice pentru diferenta dintre medii sunt cele care corespund valorilor lui p=0,005, de o parte si de alta a curbei t (3.4998). Formula de calcul pentru intervalul de incredere deriva, si in acest caz, din formula 3.24:
t=mD - D / SeD
de unde rezulta formula pentru calculul limitelor de incredere ale mediei diferentei:
D=mDtcrit*seD (formula 3.26)
In conditiile studiului nostru, decizia statistica de acceptare a ipotezei de nul a infirmat ipoteza cercetarii dar analiza intervalului de incredere poate ajuta la intelegerea mai buna a situatiei. Inlocuind valorile corespunzatoare studiului nostru, obtinem urmatoarele limite de incredere:
limita inferioara: D = -0.5-(-3.4998)*0.26= +0.40
limita superioara d = -0.5+(-3.4998)*0.26=-1.4
Rezultatul arata ca media diferentei la nivelul populatiei se afla, cu o probabilitate de 0.99 (sau 99%), intre o limita inferioara=+0.40 si o alta superioara-1.40. In acest caz, "inferior" se refera la o valoare plasata in jumatatea stanga a curbei t, unde valori inferioare sunt cele care se apropie de 0, care este media diferentei de nul. Asa cum se constata, intervalul de incredere cuprinde si valoarea 0, care exprima ipoteza de nul (diferenta nula). Acest lucru este concordant cu decizia statistica, in urma careia am admis ipoteza de nul si am respins ipoteza cercetarii. O privire mai atenta asupra datelor ar putea sa ii arate cercetatorului ca unul dintre subiecti a obtinut un scor mai mare al anxietatii dupa terapie decat inainte de terapie, fapt care este nefiresc si ar trebui analizat. Acest caz se pare ca a fost decisiv in neatingerea pragului de semnificatie. O reluare a procesului de diagnostic psihologic cu subiectul in cauza poate, eventual, conduce la concluzia ca problemele lui sunt de alta natura (de ex., sufera de depresie si nu de anxietate) si ca, in cazul sau, terapia respectiva nu are nici un efect. Refacerea calculelor cu scoaterea din esantionul de cercetare a acestui subiect (numai daca acest lucru este bine motivat), va conduce, cu siguranta, la un interval mai restrans de incredere pentru diferenta dintre medii, ceea ce va insemna o precizie de estimare mai ridicata si, implicit, poate, la atingerea pragului de semnificatie.
Nu trebuie sa omitem, de asemenea, faptul ca in exemplul nostru este vorba de un esantion foarte mic, iar esantioanele mici conduc la valori ridicate ale erorii standard a mediei si, prin aceasta, la intervale de incredere largi. In astfel de situatii riscul erorii de tip II (imposibilitatea de a pune in evidenta diferente reale, rezultat fals negativ) este mai mare. Dar, atunci cand obtinem rezultate semnificative pe esantioane mici, ele pot prezenta un nivel de incredere cu atat mai mare. In acelasi timp, esantioanele mici sunt instabile (in exemplul nostru, o singura diferenta pozitiva poate schimba rezultatul cercetarii), fapt care impune cel putin replicarea cercetarii, pentru mai multa siguranta.
Publicarea rezultatului
La publicare se vor mentiona: volumul esantionului, mediile variabilei dependente in raport cu valorile variabilei independente, valoarea testului t, pragul de semnificatie, tipul de test (unilateral sau bilateral), marimea efectului si limitele de incredere ale
diferentei. Avand in vedere faptul ca, uzual, testele statistice se efectueaza bilateral, se poate mentiona numai cazul in care testul este unilateral, eventual cu explicarea motivului pentru care a fost preferata aceasta solutie.
Pentru exemplul de mai sus, o prezentare narativa a rezultatului ar putea arata astfel:
"Un esantion de 8 subiecti cu probleme de anxietate au participat la un program de terapie anxiolitica. Nivelul anxietatii (masurat cu o scala specifica) a fost evaluat inainte si dupa programul de terapie. S-a constatat o reducere a nivelului anxietatii de la o medie de 7.50 la 7.0, dupa aplicarea terapiei. Diferenta nu a atins pragul semnificatiei statistice t(7)=-2,08, p<0.01, pentru α=0.01 bilateral, cu limitele de incredere (99%) cuprinse intre +0.40 si -1.40. Indicele d (Cohen) al marimii efectului (0.66) arata totusi existenta unei diferente relativ importante intre mediile celor doua momente. Absenta semnificatiei statistice se datoreza, foarte probabil, volumului foarte redus al esantionului si existentei unui scor extrem al unuia dintre subiecti. In concluzie, rezultatele incurajeaza utilizarea in continuare a metodei terapeutice si reevaluarea eficientei ei pe un esantion mai mare."
EXERCITII
I. Ne propunem sa scoatem in evidenta efectul stresului temporal (criza de timp) asupra performantei de operare numerica. In acest scop, selectam un esantion de subiecti carora le cerem sa efectueze un test de calcule aritmetice in doua conditii experimentale diferite: prima, in conditii de timp nelimitat, cu recomandarea de a lucra cat mai corect; a doua, in conditii de timp limitat, cu conditia de a lucra cat mai repede si mai corect in acelasi timp. Rezultatele celor doua reprize sunt cele din tabelul urmator:
Fara criza de timp |
Cu criza de timp |
Sa se rezolve urmatoarele sarcini:
a)Formularea ipotezei cercetarii si a ipotezei de nul
b)Stabilirea valorii t critic pentru α=0,05 bilateral
c)Calcularea testului t pentru esantioane dependente
d)Decizia statistica
e)Decizia cercetarii
f)Indicele de marime a efectului
g) Limitele de incredere pentru
diferenta dintre medii
h) Formularea concluzieiin formatul
recomandat
II. (a) Decideti asupra semnificatiei diferentei dintre mediile primelor doua evaluari la
statistica stiind:
N=209
m1=13.64
m2=12.56
abaterea standard a diferentei=3.16
(b)Calculati indicele de marime a efectului pentru diferenta dintre medii
(c)Estimati limitele de incredere (95%) intervalului pentru media diferentei.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 2906
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved