CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
Etimologic, cuvantul vine din latinescul testum, care semnifica o oala de pamant, capacul acesteia. Cuvantul "test" este legat de cuvantul "cap", testa, Conotatiile de sens: incercare, proba, examen critic, piatra de incercare, marturie.
Primele definitii ale testului includ, pe rand, trecerea de la proba experimentala la conditia de proba diagnostica, cu sublinierea necesitatii de standardizare a situatiei, capacitatii de masurare obiectiva a unor manifestari psihologice, pana la sublinierea expresa a conditiei moderne: obiectivitate, reprezentativitate, standardizare.
Primul care foloseste denumirea de "test mental" este in 1890, J. Mc. K. Cattell, in articolul din "Mind", Mental tests and measurement.
In 1933, Asociatia Internationala de Psihotehnica defineste testul drept: "Un test este o proba definita care implica o sarcina de rezolvat identica pentru toti subiectii examinati cu o tehnica precisa pentru determinarea succesului sau esecului, sau pentru notarea numerica a reusitei" (definitia este reluata de H. Piron in Tratatul de psihologie aplicata, II, 1954).
1954, A. Anastasi: "Un test psihologic este in mod esential o masura obiectiva si standardizata a unui esantion de comportament" (Psychological Testing). Autoarea subliniaza faptul ca: "Valoarea psihodiagnostica si predictiva a testului psihologic depinde de gradul in care serveste ca indicator al unei arii relativ largi si semnificative a comportamentului".
In 1966, L. G. Cronbach considera testul psihologic, sintetic, ca o procedura sistematica de a compara comportamentul a doua sau mai multe persoane.
In construirea si utilizarea testului trebuie respectate anumite principii si criterii: 1. standardizarea: privind conditiile de aplicare, administrarea propriu-zisa, cotarea rezultatelor si interpretarea acestora; obiectivitatea, testul deplin obiectiv este cel in care orice utilizator care ia cunostinta de o performanta la test va ajunge la aceeasi evaluare. In context subliniaza si importanta obiectivitatii de procedura, in inregistrarea rezultatelor si cotarii (Essentials of Psychological Testing).
Pentru a alege un anumit test trebuie sa se decida asupra adecvarii sale in obiectivele examenului psihologic; in ce masura testul este relevant pentru diagnoza sau predictia comportamentului care constituie scopul specific al examenului respectiv.
Alegerea poate fi ghidata de o serie de factori care ii determina valoarea practica: utilitatea, acceptabilitatea, sensibilitatea, caracterul direct, non-reactivitatea si caracterul compatibil.
Utilitatea se refera la masura avantajului practic in utilizarea unui anume instrument. De exemplu, in practica clinica are utilitate instrumentul care te ajuta sa planifici interventia, sau care iti furnizeaza un feedback adecvat privind eficienta acesteia. Aspecte ale utilitatii includ: scopul testului, lungimea, usurinta in scorare, posibilitatea de a realiza interpretari pertinente.
Acceptabilitatea include mai multe aspecte. In primul rand, cat este de potrivit continutul testului la conditia intelectuala si emotionala a persoanei testate. Multe teste implica un limbaj ceva mai sofisticat, sau un nivel de lectura mai elevat dificil pentru persoane cu o scolarizare mai slaba. Sunt instrumente care implica abilitatea de a discrimina intre diferite stari emotionale, capacitate mai putin formata la copii sau adolescenti si chiar la unele persoane adulte. Al doilea aspect pertinent este faptul ca, daca scorurile nu sunt o reflectare acurata a problemei persoanei, utilizarea instrumentului este practic nesemnificativa.
In plus, persoana trebuie sa perceapa instrumentul ca acceptabil. Daca persoana nu intelege ca masurarea pe care o realizeaza instrumentul are sens, este importanta, nu ii va acorda atentie suficienta, sau va raspunde la intamplare. Daca percepe continutul ca prea intruziv, prea ofensiv pentru intimitatea sa, raspunsurile sale vor fi afectate semnificativ. Este necesar ca in selectarea instrumentului acesta sa poata avea sens pentru persoana, sa fie acceptabil pentru subiectul care raspunde.
Sensibilitatea se refera la capacitatea testului de a sesiza schimbarile in timp. In consilierea psihologica sau in terapie, este nevoie de teste care sa poata detecta schimbarile, progresul persoanei testate de-a lungul timpului intre sedinte.
Caracterul direct se refera la capacitatea testului de a reflecta comportamentul real, gandurile sau sentimentele reale ale persoanei. Masurile directe sunt semne ale problemei, cele indirecte sunt mai ales simboluri ale problemei conducand spre inferente indirecte. De exemplu, testele de performanta sunt considerate directe, in timp ce tehnicile si testele proiective sunt prin definitie indirecte. Multe instrumente se situeaza de-a lungul acestor doua extreme, implicand in diferite ponderi caracterul direct. Cand examinarea pune accent pe fidelitatea datelor, practic devine decisiv gradul in care instrumentul are capacitatea de a reflecta direct aspectul psihic.
Non-reactivitatea semnifica calitatea testului de a nu provoca o anumita reactie subiectului astfel ca raspunsul la proba sa fie influentat de aceasta reactie. Desigur, este implicat si caracterul nonintruziv al continutului itemilor. Este importanta utilizarea acelor instrumente care nu produc o artificializare a raspunsurilor, schimbari reactive.
Criteriul final este adecvarea generala a instrumentului, sau masura in care este compatibil pentru o evaluare rutiniera; instrumentele care sunt lungi sau complicate in sistemul de scorare, desi pot sa furnizeze informatie utila nu pot fi utilizate in mod curent, frecvent pentru ca cer prea mult timp. Adecvarea se refera de asemeni si la fidelitatea si validitatea informatiei, obiectivitatea datelor pe care se poate intemeia decizia in evaluare.
Cadrul de referinta care poate ghida alegerea unor instrumente de masurare cuprinde urmatorul set de intrebari:
Ce tip de evaluari sau decizii trebuie realizate?
Ce tip de informatie este necesara pentru a realiza evaluari si decizii optime?
De ce tip de informatie dispunem deja?
Cum si de unde poate fi obtinut restul de informatie?
Ce metode si / sau instrumente avem la dispozitie pentru a obtine aceasta informatie?
Exista si / sau avem testele respective sau trebuie create?
Cum trebuie evaluate testele sau instrumentele respective pentru a fi adecvate cerintelor specifice?
Ce criterii putem utiliza in alegerea lor?
Fidelitatea
Definitia fidelitatii; metode pentru evaluarea fidelitatii testelor; interpretarea coeficientilor de fidelitate.
Definitia fidelitatii
Fidelitatea reprezinta traditional: "precizia, consistenta si stabilitatea masurarii realizate de test". Termenii de "consistenta" si "stabilitate" continua sa fie utilizati si in prezent in legatura cu fidelitatea testelor, avand sensul de repetabilitate a rezultatelor masurarii. Astfel, ultimele Standards for Educational and Psychological Tests, din 1985, definesc fidelitatea ca fiind "gradul in care scorurile testului sunt consistente sau repetabile, adica gradul in care ele nu sunt afectate de erorile de masura".
Orice test psihologic este fidel daca indeplineste urmatoarele conditii:
a. este lipsit de erori de masura, deci este precis;
b. orice persoana obtine scoruri egale la test si la o forma paralela a acestuia in situatia cand erorile de masura la cele doua teste pentru orice persoana sunt independente.
In studiul fidelitatii, erorile de masura sunt aleatoare, nu sistematice, deci sunt complet nepredictibile, indiferent de cunostintele pe care le avem despre persoanele masurate sau despre procesul de masurare. Deci corect este sa nu vorbim despre fidelitatea unui instrument de masura, ci despre fidelitatea acelui test aplicat pe o anumita populatie si in anumite conditii.
Criterii pentru fidelitatea tehnica a testelor:
dispersia rezultatelor sa fie mare;
distributia rezultatelor sa fie normala;
rezultatele aceluiasi subiect sa fie asemanatoare la re-testare.
Metode pentru evaluarea fidelitatii testelor
In functie de ceea ce masoara si de conditiile in care a fost administrat, se calculeaza unul sau mai multi dintre urmatorii coeficienti, prin care se aproximeaza valoarea fidelitatii:
A. Coeficientii de stabilitate se calculeaza prin metoda test-retest, coreland scorurile obtinute la test si la retest (acelasi test aplicat dupa un interval de timp). Arata cat de stabile sunt scorurile in timp.
B. Coeficientii de echivalenta rezulta din metoda formelor paralele, prin corelarea scorurilor obtinute la doua teste paralele, administrate aproape in acelasi timp. Arata cat de asemanatoare sunt cele doua instrumente de masura.
C. Coeficientii consistentei interne se calculeaza in cadrul analizei consistentei interne, pe baza scorurilor obtinute la un test administrat o singura data. Din aceasta categorie fac parte coeficientul a al lui Cronbach, coeficientul λ3 al lui Guttman si coeficientii ρ20-21 Kuder- Richardson. Ei indica concordanta diferitelor parti ale testului.
D. Coeficientii de fidelitate inter evaluatori se calculeaza pentru teste al caror scor este rezultatul aprecierii subiective facute de evaluator. Ei arata in ce masura parerile mai multor evaluatori concorda intre ele.
Metoda test-retest |
Metoda test-retest evalueaza gradul in care scorurile obtinute la un test de acelasi subiect sunt constante de la o administrare la alta. Se procedeaza astfel: (1) Se administreaza testul unui grup de persoane. (2) Dupa un interval de timp se administreaza testul acelorasi persoane, in aceleasi conditii ca si prima data. (3) Se calculeaza coeficientul de corelatie liniara intre scorurile observate in cele doua situatii. Valoarea obtinuta se foloseste pentru estimarea fidelitatii testului, considerandu-se ca testul este paralel cu el insusi, ceea ce inseamna ca, intre cele doua administrari ale sale, scorurile reale ale persoanelor nu s-au schimbat. Coeficientul de corelatie calculat prin aceasta metoda se numeste coeficient de stabilitate. Metoda test-retest este utila atunci cand scorurile reale ale testului masoara caracteristici durabile, generale si specifice ale persoanelor. |
Dezavantajul metodei test-retest consta in faptul ca pretinde doua administrari ale testului, ceea ce necesita timp si cheltuieli materiale.
Metoda analizei consistentei interne |
Metoda analizei consistentei interne utilizeaza pentru estimarea fidelitatii unui test dispersiile si covariantele scorurilor observate ale itemilor. Se practica o singura administrare a testului. Pe baza scorurilor itemilor se calculeaza, de obicei, unul dintre urmatorii coeficienti: coeficientul a al lui Cronbach; coeficientul λ3 al lui Guttman; coeficientul ρ20 sau ρ21 al lui Kuder-Richardson (daca itemii testului sunt binari). Coeficienti de consistenta interna indica masura in care itemii testului se refera la acelasi lucru. |
Acesti coeficienti sunt utili pentru calculul fidelitatii testelor care masoara o caracteristica unidimensionala. Indica caracterul omogen al itemilor testului sau scalei acestuia.
Metoda formelor paralele |
Metoda formelor paralele consta in administrarea a doua teste, care reprezinta instrumente de masura paralele, la momente foarte apropiate unul de altul si determinarea coeficientului de corelatie liniara intre scorurile observate ale celor doua forme. Valoarea calculata se numeste coeficient de echivalenta. Daca cele doua teste sunt paralele si daca pentru fiecare persoana erorile de masura la cele doua administrari sunt variabile aleatoare independente, atunci coeficientul de echivalenta coincide cu coeficientul de fidelitate al fiecarui test. |
Un caz particular al metodei formelor paralele il constituie metoda injumatatirii (split-half). In literatura de specialitate, aceasta este inclusa uneori in cadrul analizei consistentei interne. Metoda injumatatirii are urmatorii pasi: Se administreaza testul unui lot de persoane. Se imparte testul in doua parti cat mai asemanatoare intre ele. Se calculeaza coeficientul de corelatie intre scorurile observate la cele doua jumatati. |
Metoda formelor paralele este potrivita in cazul cand se urmareste masurarea unor caracteristici generale ale persoanelor. Asemenea caracteristici vor influenta in acelasi mod scorurile ambelor teste.
Coeficienti de fidelitate inter-evaluatori |
In cazul testelor care nu au o cotare obiectiva, cum sunt testele proiective sau cele de creativitate, scorurile subiectilor sunt influentate si de persoana care face evaluarea raspunsurilor. Pentru a verifica in ce masura scorurile testului sunt dependente de cel care a facut cotarea, se calculeaza coeficientul de corelatie liniara intre scorurile atribuite acelorasi subiecti de evaluatori diferiti. |
Cand avem de ales dintr-o multime de teste avand toate celelalte caracteristici egale, este de preferat testul care are cea mai mare fidelitate. Reguli:
1. Se vor cere niveluri inalte de fidelitate testelor folosite pentru a se lua decizii importante asupra persoanelor si celor care impart indivizii in mai multe categorii pe baza unor diferente relativ mici intre ei. In selectia profesionala, de pilda, se vor folosi teste care au coeficienti de fidelitate mai mari decat 0.90.
Se vor accepta niveluri scazute de fidelitate atunci cand testele se utilizeaza pentru a lua decizii preliminare, nu finale, si in cazul testelor care impart persoanele intr-un numar mic de categorii, pe baza unor diferente individuale mari.
3. Daca un test serveste la compararea grupelor de persoane, coeficientul sau de fidelitate poate fi mai mic, chiar cuprins intre 0.6 si 0.7. Daca testul se foloseste pentru compararea persoanelor una cu alta, coeficientul sau de fidelitate trebuie sa fie mai mare decat 0.85.
In practica se folosesc adesea teste care sunt valide pentru populatia si situatia in care sunt administrate, dar care nu au coeficienti de fidelitate foarte mari.
3. Validitatea
Validarea unui test este procesul prin care se investigheaza gradul de validitate a interpretarii propuse de acesta (APA. Standards 1985). Validarea nu se mai refera atat la instrumentul in sine, ci la interpretarea datelor furnizate de el.
Pentru o interpretare corecta a scorurilor unui test este necesar sa fie indeplinite doua conditii (Albu, 1995):
sa se stie exact ce reprezinta scorurile testului;
masurarile facute de test sa fie corecte.
Standardele APA (1985) apreciaza ca nu se poate vorbi despre "tipuri" diferite de validitate, cele recunoscute pana acum sunt doar simple etichete atribuite unor categorii de strategii de validare care nu sunt disjuncte".
In studierea validitatii testului psihologic se impun patru idei:
a. Exista numeroase metode pentru va1idarea testelor, care pot fi privite ca moduri diferite de formulare a cerintelor referitoare la teste. Corespunzator scopurilor pentru care se utilizeaza un test, se alege strategia de validare adecvata. Ea se poate baza pe analiza de itemi, pe analiza factoriala, pe determinarea corelatiilor testului cu diverse criterii etc.
b. Validitatea unui test nu poate fi estimata printr-un singur coeficient, ci se deduce din acumularea dovezilor empirice si conceptuale. Standardele APA din 1974 subliniaza faptul ca "validitatea nu se masoara, ci se deduce". Manualul testului trebuie sa contina coeficientii de validitate, dar in cazul unei aplicari particulare a testului nu se va lua in considerare un singur coeficient, ci, prin analiza lor globala, se va aprecia daca utilizarea testului este "adecvata" sau "nesatisfacatoare". Pentru a sublinia ideea ca este gresit sa se spuna "testul are validitate (de un anumit tip)", Standardele APA din 1985 modifica terminologia utilizata in legatura cu validitatea. Astfel, ele inlocuiesc denumirile cunoscute ale tipurilor de validitate cu urmatoarele "etichete" atribuite strategiilor de validare: "dovezi ale validitatii relative la continut", "dovezi ale validitatii relative la construct" si "dovezi ale validitatii relative la criteriu". Prin urmare, faptul ca scorurile testului folosit ca predictor coreleaza liniar semnificativ, la un prag de probabilitate fixat, cu valorile unui criteriu nu reprezinta o evaluare a validitatii relative la criteriu si nu permite sa se afirme ca "testul are validitate relativa la criteriu", ci doar constituie una dintre dovezile validitatii relative la criteriu a testului.
c. Validarea unui test este cumulativa. Procedura de va1idare trebuie reluata periodic pe esantioane diferite de subiecti. Ori de cate ori se face o modificare importanta intr-un test in ceea ce priveste formatul, limbajul, continutul sau instructiunile de administrare, testul trebuie revalidat.
d. Validitatea unui test depinde mai mult de felul in care este folosit testul decat de testul in sine.
Fatetele validitatii
Doua observatii importante sunt facute de Standardele APA din 1985 relativ la "tipurile" de validitate:
prin "tipuri" de validitate nu se inteleg "categorii disjuncte
nu se poate afirma ca un tip de validitate este mai potrivit decat altul pentru o anumita utilizare a testelor sau pentru o categorie specifica de inferente bazate pe scoruri.
Validitatea testului relativa la constructul masurat |
Procedura: Pentru a putea verifica daca un test masoara bine un anumit construct, este necesar sa se realizeze o descriere a constructului in termeni comportamentali concreti. Operatia se numeste "explicarea constructului" si consta din trei pasi (Murphy si Davidshofer, 199l): Se identifica acele comportamente care au legatura cu constructul masurat de test. Se identifica alte constructe si pentru fiecare se decide daca are sau nu legatura cu constructul masurat de test. Se alcatuieste cate o lista de comportamente prin care se manifesta aceste constructe. Pentru fiecare din ele, pe baza relatiilor dintre constructe, se decide daca are sau nu legatura cu constructul masurat de test. |
Prin intermediul testelor psihologice se masoara atribute abstracte ca inteligenta, motivatia, agresivitatea, depresia etc., denumite constructe. Asemenea variabile sunt construite pornind de la fapte observabile, printr-un sir de rationamente bazate pe ipoteze si deductii. Din acest motiv, validitatea relativa la construct este adesea denumita si "validitate ipotetico-deductiva" (Bacher, 1981). Toate constructele sunt insa conectate de realitate, reprezinta aspecte sau evenimente ale realitatii observabile. Constructele psihologic sunt evidentiate, direct sau indirect, de comportament sau in urma conducerii unor experimente dedicate masurarii lor.
Deoarece termenii construct si concept sau notiune sunt adesea utilizati ca sinonimi, validitatea relativa la construct a testului este denumita si "validitate conceptuala". Validarea testului relativa la constructul masurat se ocupa de calitatile psihice care contribuie la formarea scorurilor acestuia si urmareste intelegerea dimensiunilor evaluate de test.
Ideile referitoare la caracterul structural al constructelor si la existenta retelelor nomologice au condus la descompunerea operatiei de validare a testului relativa la constructul masurat, in trei componente:
validarea materialului testului (substantive validity), care necesita specificarea constructului masurat de test si se confunda uneori cu validarea continutului testului;
validarea structurii constructului aflat la baza testului (structural validity), care identifica elementele componente ale constructului si inves-tigheaza legaturile dintre ele;
validarea externa (external validity), care urmareste sa determine relatiile constructului cu alte masuratori (constructe sau variabile observate).
Validarea externa se refera la calitatea testului de a avea relatii corecte cu alte masuri psihologice; ea este denumita uneori "validitate convergenta si discriminanta" :
a. Un test are validitate convergenta daca masoara ceea ce evalueaza si alte teste sau variabile care se refera la acelasi construct, deci scorurile sale variaza (liniar sau nu) in acelasi sens cu rezultatele respectivelor masuratori.
b. Un test are validitate discriminanta daca evalueaza altceva decat diverse teste sau variabile despre care se stie ca se refera la constructe ce nu au legatura cu constructul masurat de test. Aceasta inseamna ca scorurile testului nu sunt in relatie functionala monotona (liniara sau nu) cu rezultatele acelor masuratori.
Validitatea testului relativa la continutul sau |
Operatiile de validare relativa la continut realizeaza doar analiza testului in privinta claritatii, a reprezentativitatii si a relevantei continutului sau. Ar putea fi privite ca o componenta a validarii testului. |
Acest tip de validitate este analizat la testele care se utilizeaza pentru a estima "cum actioneaza o persoana in universul de situatii pe care testul intentioneaza sa il reprezinte" (APA Standards, 1974). Ea se realizeaza dupa definirea constructului si urmareste sa verifice daca esantionul de stimuli si cel de raspunsuri observate si inregistrate in procesul de masurare sunt reprezentative pentru universul de comportamente pe care il defineste constructul respectiv.
Validitatea testului relativa la criteriu |
Exista doua strategii utilizate in mod obisnuit pentru aprecierea validitatii relative la criteriu a testelor: a. validarea predictiva; b. validarea concurenta. Validarea predictiva este interesata de gradul de eficienta al testului in prognoza comportamentului unei persoane intr-o situatie data. Ea se realizeaza prin compararea scorurilor testului cu rezultatele obtinute la criteriu dupa un interval de timp mai lung sau mai scurt. De exemplu, pentru estimarea validitatii predictive a unui test utilizat in selectia profesionala se calculeaza coeficientul de corelatie liniara intre scorurile testului, administrat, de pilda, cu ocazia finalizarii unui curs de pregatire profesionala, si masurile performantelor obtinute de aceleasi persoane dupa un anumit timp, cand tuturora li s-a creat posibilitatea sa aplice cunostintele respective. Pentru estimarea validitatii concurente este necesara obtinerea scorurilor la criteriu aproximativ in acelasi timp cu cele ale testului. Deosebirea esentiala dintre cele doua tipuri de validari relative la criteriu nu consta in lungimea intervalului de timp dintre administrarea testului si inregistrarea rezultatelor criteriului, ci in faptul ca validarea concurenta utilizeaza un esantion de populatie selectionat (personal angajat deja sau studenti admisi in facultati). Apare aici problema denumita restrangerea multimii si care face ca validarea concurenta sa nu poata fumiza totdeauna informatii corecte asupra capacitatii predictive a testului. |
Validarea relativa la criteriu se refera la gradul in care deductiile facute, pornind de la scorurile testului, concorda cu cele bazate pe scorurile unei alte masurari, numita criteriu.
Aspecte privind interpretarea validitatii:
Se apreciaza ca un test are validitate de criteriu buna atunci cand coeficientul de validitate este mare. Valoarea coeficientului de validitate evidentiaza gradul in care randamentul la test coreleaza cu rezultatele la criteriu.
In experienta practica, valoarea coeficientului de validitate predictiva al unui test este cuprinsa intre 0 si 0.60, in majoritatea cazurilor fiind situata in partea inferioara a intervalului (Guilford, 1965).
C. L. Hull a impus conditia ca un test sa fie utilizat in practica doar daca are un coeficient de validitate mai mare decat 0.45; aceasta cerinta este insa greu de realizat. Un test bun rareori poate da, cu un criteriu important, un coeficient de corelatie mai mare decat 0.5.
Considerarea validitatii ca un concept unitar si integrativ nu inseamna ca, la nevoie, validitatea nu poate fi diferentiata conform fatetelor ei si scopurilor masurarii: consecintele sociale ale testarii, rolul intelesului scorului pentru utilizarea aplicativa a testului.
Fundamentul pentru consecintele interpretarii testului il reprezinta evaluarea implicatiilor intelesurilor scorului, incluzand uneori implicarea denumirii constructului, teoriei largite care conceptualizeaza proprietatile constructului si ramificatiile relationale ale intelesului constructului si ideologia mai larga care da teoriei scop si perspectiva (de exemplu, ideologia referitoare la natura umana ca invatare, adaptare etc.).
Din aceasta perspectiva, a integrarii progresive in cadrul strategiei de validare a diferitelor semnificatii ale validitatii, in procesul de validare se impletesc atat intelesul testului cat si valoarea lui, atat interpretarea testului cat si utilizarea lui.
Normele reprezinta performantele realizate la testare de catre un esantion de subiecti luat ca model; astfel normele sunt stabilite empiric - prin determinarea comportamentului la test al unui grup reprezentativ pentru populatia careia i se adreseaza proba.
Raportam fiecare rezultat individual la rezultatele obtinute de esantionul standard ca sa putem evalua modul cum se incadreaza individul "in raport de" rezultatele populatiei din care face parte.
Pentru determinarea exacta a locului persoanei in aceasta distributie de scoruri, rezultatul este transformat intr-o unitate de masura normata. Aceste valori derivate au un scop dublu:
precizeaza locul individului fata de alti indivizi din esantion;
vor permite compararea intre rezultatele individuale la diferite teste.
Exista modalitati diferite de a transforma rezultatele brute la un test pentru a corespunde celor doua scopuri. In general, rezultatele derivate sunt de trei tipuri: norme de varsta, percentile si scoruri standard.
Tehnici de normare
Normele pe niveluri de varsta
Conceptul de varsta mentala a fost introdus in revizia scalelor de dezvoltare intelectuala de catre creatorii acestora, A. Binet - G. Simon in 1908. Probele individuale sunt grupate pe niveluri de varsta. De exemplu, probele pe care majoritatea celor de 8 ani le-au putut rezolva au fost cuprinse in testul dedicat pentru 8 ani. Rezultatul unui copil la acest test va corespunde celui mai inalt nivel de varsta pe care este in stare sa il rezolve. Daca un copil de 8 ani reuseste la probele cuprinse pentru nivelul de 10 ani, varsta sa mentala este de 10 ani, desi cea cronologica este de 8 ani. Este deci cu doi ani inaintea varstei sale, realizand performantele unui copil de 10 ani. Rezultatele medii obtinute de copii in cadrul grupelor de varsta reprezinta normele de varsta pentru un astfel de test.
In practica, rezultatele realizate de individ la scale de varsta de acest tip prezinta un grad de imprastiere destul de mare. Un subiect poate avea reusite superioare varstei sale pentru o serie dintre subteste si, in acelasi timp, poate sa nu reuseasca pentru altele, care sunt sub nivelul sau de varsta. Se introduce de aceea conceptul de varsta de baza - nivelul cel mai inalt pana la care se pot rezolva testele (mai jos de care toate testele pot fi corect rezolvate).
Pentru a permite o interpretare uniforma, indiferent de subiect sau de varsta, a fost introdus coeficientul de inteligenta, Q.I. Stern si Kuhlman sunt primii care subliniaza necesitatea introducerii acestui sistem de masurare care a fost utilizat in practica prima data pentru scalele Stanford - Binet. Q.I.-ul reprezinta raportul dintre varsta mentala si cea cronologica, fractia fiind multiplicata cu 100.
Daca varsta mentala este aceeasi cu varsta cronologica, coeficientul de inteligenta = 100. Rezultatul reprezentat printr-un coeficient sub 100 indica gradul de distanta fata de normal; ca si cel peste 100 care reprezinta avansul fata de normal. Pentru a putea compara direct valorile Q.I. la varste diferite, deviatia standard nu trebuie sa varieze in functie de varsta. Conditia presupune ca valorile deviatiei standard la varste mentale sa creasca proportional cu varsta.
Percentilul se refera la procentul de persoane dintr-un esantion standard care se situeaza sub un rezultat dat. Daca 30% dintre subiecti rezolva mai putin de x itemi corect, acest rezultat neprelucrat, x va corespunde celui de al 30-lea percentil. Gama de percentile este intre 1 si 99, si reprezinta procentul de persoane din grupul de normare care au scoruri la nivelul sau sub nivelul unui anumit scor.
Un percentil indica populatia relativa pentru individ dintr-un esantion standard. Percentilele pot fi considerate ca ranguri intr-un grup de 100 de subiecti. Modul de determinare a percentilelor: se socotesc toate scorurile cu valori mai mici decat scorul care ne intereseaza; se imparte la numarul total de scoruri; se inmulteste cu 100.
In rangul de percentile scorul mediei este percentila 50; P 50, ca masura a tendintei centrale. Percentilele peste 50 reprezinta succesiv realizari deasupra mediei, iar cele sub 50, realizari inferioare. Percentilul 25 si percentilul 75 sunt denumite primul si al treilea quartil (sfert) delimitand sfertul inferior si sfertul superior ale distributiei scorurilor in populatia de referinta. Rezultatul neprelucrat inferior oricarui rezultat din esantionul standard si rezultatul superior oricarui rezultat din esantionul standard vor avea rangul P 0 si, respectiv, P 100.
Rezultatele standard se pot obtine prin transformari lineare sau prin transformari nelineare ale rezultatelor brute.
Rezultatele derivate linear se numesc si rezultate standard sau rezultate z. Calcularea rezultatului z cere scaderea din rezultatul brut al persoanei media grupului normativ si impartirea acestei diferente la abaterea standard a grupului. Orice rezultat brut egal cu media va avea valoarea lui z = 0.
z reprezinta media ; σ reprezinta abaterea standard
Avantaj: intre rezultatele z avem aceeasi distanta.
Dezavantaj: in situatia in care media e mai mare ca rezultatul, scorul e negativ.
Cotele de tip T au intervenit pentru a facilita exprimarea scorurilor sub medie.
In cotele T, se considera ca distributia are media 50 si abaterea standard 10.
Un motiv principal al acestei proceduri consta in faptul ca cele mai multe distributii ale rezultatelor brute, mai ales pentru teste de abilitati, sunt aproape de curba normala a lui Gauss.
Rezultatele standard normalizate sunt rezultate standard exprimate in termenii unei distributii ce a fost transformata pentru a se potrivi curbei normale de distributie.
Exista diferite modalitati de a normaliza:
Impartirea acestei curbe in 5 clase normale:
Impartirea acestei curbe in 7 clase normale;
Impartirea acestei curbe in 9 clase standard (stanine);
Impartirea in 11 clase standardizate.
Pasii procedurii includ: calcularea tabelului de frecvente si impartirea lotului de subiecti in unitati procentuale egale, respectiv intervale intre repere care nu sunt echidistante.
Etalonul constituit in 5 clase normalizate are ca procente: 6.7%, 24,2%, 38.2%, 24.2% si 6.7% dintre subiectii lotului de referinta.
Etalonul in 7 clase normalizate, 4.8%, 11.1%, 21.2%, 25,8%, 21,2%, 11.1% si 4.8%
Etalonul in noua clase, staninele, are ca procente: 4.0%, 6.6%, 11%, 17.5%, 19.6%, 17.5%, 11%, 6.6%, 4.0%.
Etalonul in 11 clase, de obicei util pentru testele de personalitate: 3.6%, 4.5%, 7.7%, 11.6%, 14.6%, 16.0%, 14.6, 11.6%, 7.7%, 4.5%, 3.6%.
Acest tip de transformari nonlineare se efectueaza numai cand exista un esantion numeros si reprezentativ si cand deviatia standard de la rezultatele testelor se datoreaza defectelor testului si nu caracteristicilor esantionului sau altor factori care afecteaza esantionul. Cand distributia reala a rezultatelor brute se apropie de curba normala de distributie, rezultatele standard derivate linear si rezultatele standard normalizate vor fi aproape identice. In astfel de situatii, rezultatele standard si clasele normalizate vor servi aceluiasi scop.
Comparatii a diferite tipuri de scoruri la test:
Tip de scor |
Avantaj |
Dezavantaj |
scor brut |
Da un numar precis de puncte obtinute la test |
Nu poate fi interpretat sau comparat |
rang percentil |
Este mai usor inteles de utilizatori. Nu cere statistici sofisticate. Indica o pozitie relativa a scorurilor in percentile. Mai adecvat pentru datele fara distributie normala (distributii asimetrice) |
Utilizeaza unitati de masurare ordinale; utilizeaza deci unitati inegale de masurare. Nu permite o tendinta centrala. Nu poate fi comparat daca grupele nu sunt similare. Distorsioneaza mult diferentele de scor in partea de sus si de jos a distributiei. |
stanine |
Scorurile sunt unitare. Poate fi exprimata tendinta centrala. Simple si utile. |
Se poate ajunge sa nu permita suficiente unitati de scor pentru a putea sa diferentiezi printre scoruri. Sunt insensibile la diferentele de marime din cadrul staninei. |
scoruri standard |
Derivate din proprietatile curbei normale. Reflecta diferentele absolute dintre scoruri. Se poate calcula tendinta centrala si corelatia. Daca grupele de referinta sunt echivalente, permit compararea de la test la test. |
Inadecvate pentru datele ce nu se grupeaza conform curbei normale. Sunt dificil de explicat pentru utilizatori. |
Stabilirea unei necesitati: luarea in considerare a cerintelor formale si informale pentru test. Trebuie sa realizam un fel de ancheta sociala pentru a vedea daca aceasta necesitate este reala sau tine de imaginarul nostru. Trebuie sa scanam disponibilitatea pietei, sa vedem daca exista ceva similar (pentru a nu repeta).
Definirea obiectivelor si parametrilor testelor: stabilim scopul testului (cine este testat si de ce a fost ales acest test), clarificam modul in care informatia utilizata de test va fi utila si celui care da testul, si beneficiarului. Trebuie sa luam in considerare tipul de format al itemilor si tipul de format al raspunsurilor, dar si numarul de itemi ce vor fi inclusi.
Selectarea unui grup de experti in domeniul respectiv: se discuta din nou obiectivele, scopurile si parametrii testului si se determina o prima macheta a testului.
Scrierea itemilor: se utilizeaza experti din domeniul testului sau specialisti din aria domeniului respectiv pentru a scrie itemii. Dupa ce au fost scrisi, itemii trebuie sa fie revizuiti (din punctul de vedere al continutului) de cel putin o persoana sau de catre o echipa care nu a fost implicata in scrierea lor.
Faza de teren. Itemii sunt supusi realitatii. Un prim esantion de itemi este utilizat pentru a fi testati subiecti reali, dintr-un anumit grup tinta (grup realizat in functie de varsta, sex, pregatire profesionala etc.). In urma testarii, se va calcula gradul de dificultate si de discriminare al itemilor (aceasta reprezinta analiza de itemi).
Revizuirea itemilor, care se produce in urma analizei de itemi. Se verifica daca exista itemi cu o anumita incarcatura nedorita sau ce includ prejudecati (de exemplu, sexuale sau legate de minoritati). Sunt eliminati itemii care pot sa fie incorecti, nedrepti sau pot sa lezeze anumite grupuri de indivizi.
Alcatuirea formei finale a testului. Se verifica adecvarea grilei de scorare, mergandu-se pana la subtilitati in ceea ce priveste scorarea raspunsurilor. Se intampla foarte multe accidente in faza finala, astfel ca este necesara interventia unui "cap limpede". Se re-verifica itemii si grila de scorare.
Constituirea normelor si calcularea finalitatii si validitatii:
1. sunt verificate datele tehnice ale testului. Se fac procedurile de esantionare sau de constituire a loturilor de experimentare;
are loc administrarea si scorarea formei finale a testului;
3. se calculeaza finalitatea si itemii de finalitate;
4. are loc construirea normelor adecvate de interpretare.
Forma pe care o ia acest raport este de obicei direct legata de tipul de examen si de cerintele beneficiarului. Raportul unui examen clinic difera in amploare si profunzime a interpretarilor de raportul unui examen de selectie. Raportul privind consilierea educationala difera in continut si centrare pe probleme de raportul de expertiza judiciara. Rapoartele difera de asemenea si in functie de nivelul de comprehensibilitate al beneficiarului.
Conditiile si principiile generale de intocmire a raportului sunt prezentate in standardele de testare educationala si psihologica. Principiile respective se refera la obiectivitate, non-intruziunea, lipsa de ambiguitate si subiectivism, respectarea confidentialitatii, neutilizarea unor termeni care nu sunt inteligibili beneficiarului si explicarea semnificatiei rezultatelor.
O deficienta consta in descriptivismul exagerat (privind compor-tamentul subiectului in timpul examinarii) fara a oferi si comentarii asupra acestor prezentari. Simpla enumerare a observatiilor facute, fara comentarii si integrarea lor intr-un sens anume, poate genera o varietate larga de interpretari beneficiarului, conducand cel mai adesea spre imagini gresite asupra persoanei testate, incarcate de subiectivismul celui care citeste un astfel de raport. In raport se includ si explicatiile posibile, atentionand cand acestea nu sunt certe. In situatia unor rezultate contradictorii este important ca psihologul sa prezinte obiectiv constatarile si sa incerce explicarea inconstantelor, incertitudinilor, discordantelor dintre date.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 4895
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved