Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
AstronomieBiofizicaBiologieBotanicaCartiChimieCopii
Educatie civicaFabule ghicitoriFizicaGramaticaJocLiteratura romanaLogica
MatematicaPoeziiPsihologie psihiatrieSociologie


CONSTRUCTIA TESTELOR PSIHOLOGICE

Psihologie psihiatrie



+ Font mai mare | - Font mai mic



CONSTRUCTIA TESTELOR PSIHOLOGICE

Introducere

Constructia testelor psihologice este un demers care a dus la crearea unei adevarate stiinte. Asa cum s-a putut observa in capitolele anterioare, in care au fost prezentate secvente metodologice specifice elaborarii de teste sau chestionare psihologice, procesul de constructie a unui test presupune numeroase experimentari si abordari metodologice destul de complexe. Putem chiar afirma ca a construi un test de pe pozitii stiintifice nu reprezinta un demers intamplator sau o speculatie de fotoliu, ci el constituie rezultatul unui demers bine gandit de aplicare a principiilor impuse de procesul construirii testului. Acest capitol va fi dedicat punctarii elementelor de baza ale metodologiei de construire a testelor psihologice. Desigur, noi ne vom referi preponderent la testele standardizate, care au intrat in patrimoniul psihodiagnozei individuale sau organizationale. Bineinteles, referiri vor fi facute si la asa-zisele teste care apartin unor elaborari bazate pe simtul comun si care fac obiectul unor interventii ocazionale, cum ar fi testele de cunostinte construite de profesori pentru verificarea periodica a elevilor, sau cele care se administreaza dupa parcurgerea unui curs de instruire initiat de o firma de consultanta, ori testele construite cu ocazia unui studiu de cercetare etc. Acestora li se mai spune si teste empirice.



Demersul procesual de proiectare a unui test presupune parcurgerea a cinci etape (Albu, 2000; Cohen, Montague, Nathanson, Swerdlik, 1988; Murphy & Davidshofer, 1991):

conceptualizarea testului

construirea testului

aplicarea initiala a testului

analiza itemilor

revizuirea testului

Pe scurt, prima etapa a proiectarii testului debuteaza cu definirea conceptului care se doreste a fi masurat (conceptualizarea testului) Urmeaza apoi procesul de culegere si sau construire a itemilor care intra (potential) in structura de continut al testului si despre care se crede ca ar defini cel mai bine conceptul studiat (construirea testului). Dupa construirea bazei de itemi se structureaza o prima forma ipotetica a testului care va fi administrata unui lot de subiecti (studiu pilot). Datelor rezultate in urma studiului pilot vor fi analizate realizindu-se un studiu preliminar de analiza a fiecarui item si unul global. Procedura statistica utilizata este cunoscuta sub denumirea de 'analiza de itemi", ea furnizandu-ne informatii asupra calitatii itemilor testului. In urma acestui demers, unii itemi vor fi revizuiti, altii respinsi si altii mentinuti in test/chestionar. Desigur, procesul de analiza de itemi poate include la fel de bine si studiul consistentei interne a probei, validitatea si capacitatea lor discriminativa, nivelul de dificultate al itemilor etc. Pe baza analizei de itemi testul va fi restructurat si administrat unui lot reprezentativ de subiecti. Procedura de revizuire va fi repetata periodic din diferite ratiuni legate mai mult de perimarea in timp a versiunii initiale a probei. (Amintim in acest sens ca timpul a fost acela care a erodat prima versiune a testului Binet-Simon, progresul socio-economic impunand restandardizarea periodica a acestuia.) Figura 5.1 ne prezinta o schema generala de derulare a etapelor de construire a unei probe psihologice.

Figura 5.1. Demersul de proiectare a unui test psihologic.

Conceptualizarea testului

De fapt, intentia de a construi un test, indiferent de natura sa, pleaca de la o trebuinta de ordin practic, de selectie de personal, initierea unei cercetari, testarea cunostintelor, publicarea unui articol intr-o revista care ofera diverse amuzamente etc. Altfel spus, creatorul unui test, isi construieste in mintea sa tipul de test pe care doreste sa-l proiecteze. Intotdeauna insa, proiectantul unui test il va gandi pe acesta in termeni comportamentali: 'Doresc sa construiesc un test care sa masoare inteligenta emotionala la manageri' sau 'Testul meu trebuie sa masoare cantitatea de cunostinte achizitionate in urma cursului pe care l-am predat si deprinderile de a le operationaliza'. In general, la baza crearii de noi teste pot sta foarte multe cauze cum ar fi aparitia unor concepte noi (inteligenta emotionala) sau necesitatea de a stabili diferite nivele de expertiza pentru profesiile relativ noi aparute pe piata (agent comercial, asistent director/manager, proiectant de interfete cu calculatorul etc.)

Indiferent de stimulul sau trebuinta care determina necesitatea de proiectare a unui test, proiectantul va trebui sa raspunda la o serie de intrebari, aceasta pentru a fi luat in serios de specialisti si sa poata fi luat in considerare in vederea unei eventuale publicari si distributii pe piata testelor (Cohen, Montague, Nathanson, Swerdlik, 1988):

Care este obiectivul testului? Difera acesta de cele ale testelor deja existente si proiectate sa masoare acelasi construct? Cum va fi pus in aplicare obiectivul respectiv?

Este intr-adevar nevoie de acest test? La ce nivel va fi testul mai bune decat cele existente? Va fi mai consistent? Mai valid? Mai usor de inteles? Care vor fi punctele slabe ale acestuia? Cine va folosi testul si de ce?

Care este categoria de subiecti carora le va fi aplicat testul? Cine va avea nevoie de datele rezultate in urma aplicarii lui? De ce, in ce scop?

Ce arie va acoperii testul din punctul de vedere al continutului? Ce diferente exista intre continutul testului nou si cea a testelor similare, deja existente?

Cum va fi administrat testul? Se va aplica individual sau in grup, sau ambele? Ce diferente vor exista intre administrarea individuala si cea de grup? Cum se vor reflecta aceste diferente in scorurile obtinute la test?

Care este formatul ideal pentru test? De ce? Va putea fi administrat cu ajutorul calculatorului, va putea fi cotat si/sau interpretat?

Ar trebui sa fie dezvoltate mai multe forme paralele ale testului?

Ce instruire ar trebui sa aiba utilizatorul testului pentru a-l administra sau interpreta corect? Ce experienta si calificare trebuie sa aiba cel ce va utiliza datele rezultate din aplicarea testului? Ce restrictii, in cazul in care exista, vor trebui impuse pentru distribuirea si utilizarea testului?

Ce tip de raspunsuri presupun itemii testului? Ce comportamente "din lumea reala" vor putea fi anticipate prin corelarea diferitelor comportamente cu raspunsurile la test? De ce rezultatele la acest test sunt importante?

In functie de natura testului si de intrebarile specifice, raspunsurile la intrebarile mentionate vor directiona interventia proiectantului de test in activitatea de rationament pe care o va utiliza, ii va ghida studiul literaturii de specialitate chiar si modalitatile de experimentare. Cand toate aceste elemente vor fi rezolvate, cercetatorul sau creatorul de test va putea incepe procesul propriu-zis de construire a acestuia.

Construirea testului

Scalarea. Am mentionat in Capitolul 2 , ca masurarea reprezinta procesul de "atribuire de numere in functie de anumite reguli" si ca scalele reprezinta aceste reguli de masurare. Scalarea se poate defini ca procesul de stabilire a regulilor de atribuire a numerelor in scop de masurare. Altfel spus, scalarea se refera la procesul prin care instrumentele de masurare sunt construite si "calibrate", modul in care numerele (sau alti indici) - valorile scalare - sunt atribuite pentru a identifica diferite nivele/intensitati ale trasaturilor, atributelor sau caracteristicilor care sunt masurate.

Tipuri de scale Scalele reprezinta instrumente utilizate pentru a masura ceva. Aceste instrumente pot fi categorizate dupa o varietate de tipologii ca o functie a diferitelor caracteristici.

In domeniul testelor psihologice, scalele pot fi concepute ca si "instrument utilizate pentru a masura ceva" - acest "ceva" fiind, in general, o trasatura psihologica, o caracteristica sau atribut. Se poate discuta despre diferite tipuri de scale. Am vazut, de pilda, ca scalele pot fi clasificate de-a lungul unui nivel continuu de masurare; ne referim aici la scalele nominale, ordinale, de interval si de raport. Dar am putea descrie scalele si altfel. Daca, spre exemplu, raspunsul subiectilor carora li s-a aplicat un test este influentat de varsta lor atunci ne vom referi la o "scala a varstei". Daca raspunsul subiectilor se refera la note scolare, se poate spune ca testul in cauza este "o scala a notelor scolare". Daca toate scorurile brute la test vor fi transformate in scoruri cuprinse intre 1 si 9, atunci ne vom referi la test ca fiind o scala exprimata in stanine. Daca avem in vedere nivelul de masurare pe care-l permite un test, atunci acesta poate fi definit ca: nominal, ordinal, de interval sau de raport. De asemenea, o scala poate fi unidimensionala sau multidimensionala, comparativa sau categoriala.

Autorii testului sunt intotdeauna in masura sa stabileasca metoda de masurare (adica, scalarea testului) in functie de cum cred ei ca aceasta este potrivita modului in care au conceptualizat masurarea trasaturii(lor) de interes. Mentionam ca nu exista doar o singura modalitate de scalare, acest lucru se poate realiza prin diferite metode. De asemenea, nu putem afirma ca exista un singur tip de scala calificat ca fiind cel mai bun"; o scala poate fi nominala, ordinala, de interval sau de raport, depinde de tipul de variabile masurate, de obiectivele scalei si legimitatea matematica a manipularilor si transformarilor datelor rezultate. In acest context, in cazul scalelor nominale se admite utilizarea unui numar redus de proceduri statistice, in timp ce scalele de raport le pot include orice tip de prelucrari statistice.

Metode de scalare In general, se presupune ca un subiect ar poseda mai multe sau mai putine din caracteristicile masurate de un test in functie de scorurile obtinute; cu cat scorul este mai mare sau mai mic cu atat putem afirma ca subiectul in cauza poseda mai multe sau mai putine din calitatile masurate. Cum sunt atribuite numerele raspunsurilor la un test?

Sa presupunem ca se doreste crearea unei "scale a nivelului de profunzime a transei hipnotice la care cu cat scorurile unui subiect sunt mai mari cu atat se considera ca acesta se afla intr-o transa hipnotica (TH) mai profunda (Cohen, Montague, Nathanson, Swerdlik, 1988). Doua dintre conditiile acestui test sunt: sa fie scurt si usor de administrat. Se ia decizia preliminara ca testul sa cuprinda doar 10 itemi si ca scorurile posibile la test vor varia de la 0 la 10 (unde 0 reprezinta o stare lipsita de hipnoza, iar 10 indica o stare de transa hipnotica profunda).

Urmatorul pas presupune realizarea unei baze de itemi care sa cuprinda aproximativ 20 itemi din care se vor selecta ulterior doar 10 itemi, cei care masoara cel mai bine constructul studiat. O metoda de realizare a acestei baze de itemi consta in consultarea unor experti in problema hipnozei care vor avea ca sarcina sa genereze, in ordine crescatoare, 10 comportamente care, din experienta lor, ar reprezenta 10 indicatori ai diferitelor niveluri de manifestare a acesteia.

Prin urmare, scala va rezulta din confruntarea rezultatelor obtinute de la experti si prin rezolvarea discrepantelor de rationament, prin metode cum ar fi: intervievarea expertilor sau consultarea literaturii de specialitate. Unii itemi ai scalei la care se raspunde cu Da sau Nu (cu un punct atribuit pentru fiecare raspuns Da) sunt de tipul (in ordine crescatoare, indicata de experti):

  1. Subiectul nu asculta nici o comanda.
  2. Subiectul asculta doar comenzile simple conform careia pleoapele ii sunt inchise si nu poate deschide ochii.
  1. Subiectul raspunde la sugestii de halucinatie pozitiva (exemplu, "exista un elefant alb in camera").
  2. Subiectul raspunde la sugestii de halucinatie negativa (exemplu, "in camera nu suntem decat tu si eu" - cand in realitate camera este plina de oameni)

10. Sugestii de analgezie (incapacitatea de a simtii durerea) este atat de puternica incat pacientul poate fi supus unei operatii chirurgicale serioase fara anestezie.

Anumite informatii despre TH si metoda utilizarea lor pentru a proiecta scala respectiva sunt utile pentru clarificarea continutului scalei. TH este o scala ordinala pentru ca diferitele "niveluri de profunzime" sunt nu numai denumite ci si ierarhizate. Totusi, nu vom gasi o nivelare a intervalelor de masurare, avand in vedre ca nu se solicita intervale egale intre punctele scalei. Scalele ordinale, precum TH, pot fi obtinute prin diferite metode, cum ar fi aceea de utilizare a tehnicilor de sortare in cadrul careia indivizii (numiti si "judecatori") care fac ierarhizarea, sorteaza un pachet de cartonase ce se refera la masura in care o anumita trasatura este reflectata de ceea ce este ilustrat pe cartonas. De exemplu, un mod de utilizare a tehnicilor de sortare in vederea construirii unei scale pentru masurarea "atractivitatii fizice a femeilor din punctul de vedere al colegilor studenti de sex masculin" ar consta in folosirea cartonaselor pe care sa fie reprezentat un desen sau o poza a unei femei la care se va schimba cate unul dintre atributele sale de la un cartonas la altul (precum: inaltimea, greutatea, culoarea parului, etc.). Un esantion reprezentativ de barbati vor fi instruiti sa sorteze cartonasele de la "cea mai atractiva" la "cea mai neatractiva".

Tehnicile de sortare pot fi utilizate si pentru construirea scalelor nominale. In acest scop subiectii vor trebui sa sorteze cartonase (sau obiecte, etc) in categorii exclusive mutual, fiecarei categorii fiindu-i atribuit un numar si sau un nume. Sarcina de sortare poate fi folosita si pentru obtinerea scalelor de interval - sau a scalelor cu intervale aparent egale.

Pentru edificarea asupra tehnicilor de scalare, se poate consulta H.D. Pitariu (2000). Managementul resurselor umane. Evaluarea performantelor profesionale. Bucuresti: All/Beck.

Scrierea itemilor testului - crearea bancii de itemi.

In scrierea itemilor unui test, autorul acestuia trebuie sa raspunda la trei intrebari:

Care va fi aria de acoperire a itemilor?

Care dintre tipurile de format ale itemilor va fi utilizat?

Cati itemi va contine testul?

Cand se construieste un test standardizat ce contine itemi cu raspunsuri multiple se recomanda ca numarul itemilor dezvoltati pentru prima aplicare sa fie dublu fata de versiunea finala a testului. De asemenea, trebuie luat in considerare si numarul formelor sub care va fi proiectat testul, astfel, se va inmulti numarul de itemi necesari pentru crearea bazei de itemi pentru o singura forma a testului cu numarul de forme pe care-l dorim sa-l acoperim.

Nu trebuie omise nici variabile precum scopul testului si numarul de subiecti ce urmeaza a fi testat la o administrare a acestuia. Daca, de exemplu, scopul testului este de a evalua un numar mare de militari din punctul de vedere al capacitatii intelectuale minimale, utilizarea unui test care presupune construirea raspunsului, ca si a unuia cu itemi usori ar fi inadecvata. Este preferabila folosirea unui test care solicita din partea subiectilor sa aleaga dintre mai multe raspunsuri alternative pe cel corect. Acest tip de itemi faciliteaza cotarea computerizata si poate opera cu un numar mare de subiecti.

Formatul itemilor testului Itemii care presupun alegerea raspunsului corect din mai multe alternative, constituie baza constructiva pentru multe teste de aptitudini, dar mai ales de cunostinte. Daca testul este proiectat sa masoare intensitatea unei anumite trasaturi/calitati, sarcina subiectilor este de a selecta alternativa care raspunde cel mai bine intrebarii raportandu-se la propria persoana.

Exista trei tipuri de formate de selectare a raspunsului: raspunsuri cu alegere multipla, potrivire si de tipul adevarat/fals (Cohen, Montague, Nathanson, Swerdlik, 1988). Asa cum este ilustrat de itemul A, raspunsul multiplu este constituit din trei elemente: (1) radacina, (2) o alternativa corecta si (3) o serie de alternative incorecte, cunoscute sub numele de distractori:

Itemul A

Radacina à un test psihologic, interviu si studiu de caz sunt:

Alternativa corecta à (a) ìnstrumente de evaluare psihologica

(b) modele comportamentale standardizate

(c) instrumente de evaluare de incredere

(d) masuri relationate teoretic

Acum analizati itemul B:

Itemul B

Un bun item cu raspunsuri la alegere dintr-un test care masoara nivelul de realizare personala:

(a)    are un singur raspuns corect

(b)   are alternative care sunt paralele din punct de vedere gramatical

(c)    are alternative similare ca lungime

(d)   are alternative care se potrivesc din punct de vedere gramatical cu radacina

(e)    include pe cat mai mult posibil din continutul itemului in radacina pentru a evita repetitia

(f)     evita distractorii ridicoli

(g)    nu este exagerat de lung

(h)    toate de mai sus

(i)      nici una de mai sus

Daca selectezi (h) la itemul B ai raspuns corect. In procesul de parcurgere a listei de alternative se poate observa ca itemul B incalca multe din regulile pe care le propune.

Gruparea itemilor prin potrivire/cuplare este un gen de item cu raspunsuri multiple. Subiectului i se prezinta doua coloane cu raspunsuri, acesta trebuind sa identifice care din alternativele din prima coloana se potrivesc cu cele din a doua. Exemplu:

Potriviti numele urmatorilor actori cu rolurile pe care l-au interpretat scriind numarul adecvat in dreptul literei din prima coloana:

______ A. Sylvester Stalone 1. Topper

______ B. Leo G. Carroll 2. Victor

______ C. Ernest Borgnine 3. Arthur

______ D. Cliff Robertson 4. Rocky

______ E. Dustin Hoffman 5. Charly

______ F. Christopher Reeve 6. Marty

______G. Barbra Streisand 7. Luke

______ H. Robin Williams 8. Superman

______ I. Julie Andrews 9. Popeye

______ J. Paul Newman 10. Tootsie

______ K. Dudley Moore 11. Yentl

Itemul cu raspuns de tipul adevarat/fals este constituit dintr-o propozitie care trebuie examinata pentru a indica daca aceasta este un fapt sau nu. Aceasta propozitie trebuie sa contina doar o singura idee, sa nu fie excesiv de lunga si sa nu se refere la un subiect care sa necesite o dezbatere, adica sa fie ori adevarat ori fals.

Ca si itemii cu raspunsuri multiple, itemul - adevarat/fals are avantajul de a putea fi aplicat fara probleme la o varietate larga de situatii si tematici. In cazul acestuia nu mai este nevoie de alternative distractoare, ca in cazul itemilor cu raspunsuri la alegere. Prin urmare, este si mai usor de construit. Unul dintre dezavantaje ar fi acela ca probabilitatea de a obtine un raspuns corect doar datorita sansei (prin ghicire) este pentru fiecare item de .5 sau 50% (in comparatie cu .25 sau 25% in cazul intrebarilor cu raspunsuri multiple cu patru alternative).

O alternativa la formatul de tipul alegerii raspunsului corect este aceea care presupune construirea lui - subiectul trebuie sa compuna si sa dea raspunsul corect sau sa-l selecteze. Exista trei tipuri de astfel de itemi: (1) care presupun completarea, (2) cei care impun un raspuns scurt si (3) eseul. In primul caz, subiectul trebuie sa completeze o propozitie incompleta, fie cu un cuvant fie cu o fraza; de exemplu:

Abaterea standard este considerata in general cea mai utila modalitate

de masurare a ____________.

Un astfel de item trebuie sa fie astfel compus incat raspunsul corect care trebuie dat sa fie unul specific. Itemul care presupune o completare si la care se poate raspunde in mai multe moduri poate duce la probleme de cotare. Raspunsul corect la itemul de mai sus este 'variabilitatea'. O metoda alternativa de a-l scrie este sub forma unui item care cere un raspuns scurt:

Ce statistica descriptiva este in general considerata ca fiind cea mai

utila pentru a masura variabilitatea?____________

Un raspuns succint bun, presupune un cuvant, un termen, o propozitie sau un paragraf - desi ceea ce depaseste un paragraf poate fi considerat ca raspuns de tip eseu; de exemplu:

Comparati definitiile si tehnicile celor doua tipuri de conditionare:

clasica versus operanta. Includeti si exemple ale modului in care

principiile fiecareia au fost aplicate in domeniul clinic ca si in cel

educational.

Raspunsul de tip eseu este util atunci cand autorul vrea ca subiectul sa demonstreze profunzimea cunostintelor sale cu privire la un singur subiect. Fata de toate celelalte tipuri de itemi, acesta permite o reproducere a materialului invatat, dar si oferirea unui raspuns creativ prin exprimarea informatiei cerute de test utilizand propriile cuvinte. De asemenea, abilitatile pe care le presupune un astfel de item difera de cele implicate in oferirea raspunsului la itemi cu variante multiple sau de tipul adevarat/fals; astfel, eseul presupune abilitati de reactualizare a informatiei, organizare, planificare si scriere, in timp ce ceilalti itemi presupun doar recunoastere. Dezavantajul testelor cu itemi de tip eseu este acela ca necesita un timp mare de completare si un anumit grad de subiectivitate in cotare (Cohen, Montague, Nathanson, Swerdlik, 1988)

Itemii continuti in baza de date vor contine si sistemul de cotare, uneori se poate mentiona si gradul de dificultate, actiune utila atunci cand se selectioneaza itemii din componenta testului respectiv. Banca de itemi este indicat sa contina cu 20% mai multi itemi decat lungimea testului pe care il construim. In cazul testelor de cunostinte se recomanda ca numarul itemilor sa depaseasca cu mult numarul itemilor din care se va alcatui testul.

Construirea si experimentarea variantei initiale a testului.

Dupa crearea bazei de itemi din care vor fi extrasi itemii din versiunea finala a testului, se alcatuieste prima versiune a acestuia care va face obiectul unui studiu pilot. Pentru aceasta, se are in vedere nivelul de dificultate al fiecarui item deoarece, in general, testele cognitive este bine sa contina itemi aranjati in ordinea gradului de dificultate, aceasta din ratiuni psihologice de motivare a subiectului pe parcursul rezolvarii testului (rezolvarea initiala a unor itemi cu un grad mic de dificultate, va mobiliza subiectul pentru a obtine performante din ce in ce mai mari). In principiu, nu exista variabila lipsita de varianta. Varianta zero, arata F.J Landy, este un caz absolut particular, dar care trebuie amintit (Guion, 1984). In practica, varianta zero apare cand raspunsurile unui grup de subiecti la itemul unui test sunt constant aceleasi. Varianta zero ne informeaza asupra unui viciu de constructie sau o ipoteza gresit formulata, ori, adesea, introducerea ei este este o masura voita. De obicei, constructorii de test, utilizeaza itemi cu varianta zero ca itemi de start, pentru a nu descuraja subiectii si pentru a-i motiva sa continue proba. Deci, in baza de date, este admisa prezenta unor itemi cu varianta zero. Ei vor fi inclusi intotdeauna ca itemi de start ai testului sau la inceputul unui subtest.

In multe teste, mai ales la cele cognitive, itemii sunt aranjati in ordinea nivelului de dificultate. De la acest principiu fac exceptie testele de cunostinte.

Odata testul construit, urmatorul pas este aplicarea pe un lot reprezentativ de subiecti.. Aici se poate face precizarea ca lotul de subiecti pe care se va aplica testul, trebuie sa fie aproximativ identic cu cel pentru care acesta a fost creat. De exemplu, daca un test de reprezentari spatiale a fost proiectat pentru a realiza selectia prelucratorilor prin aschiere, este indicat ca experimentarea testului sa se faca pe un lot de prelucratori prin aschiere si nu pe studenti de la psihologie.

In ceea ce priveste dimensiunea lotului experimental, este recomandat ca acesta sa nu fie mai mic de 50 (unii autori sustin ca daca numarul itemilor dintr-un test creste, acelasi lucru ar trebui sa se intample si cu numarul subiectilor implicati in testarea initiala). In functie de ceea ce se intentioneaza sa se faca, numarul subiectilor poate sa creasca. De exemplu, daca se lucreaza cu doua grupe contrastante, se impune ca in fiecare grup sa existe cel putin 50 de subiecti.

Experimentatorul va fi, de asemenea, atent ca situatia si mediul de testare sa fie aproximativ identice cu conditiile propriu-zise de testare. Astfel autorul testului trebuie sa se asigure pe cat posibil ca rezultatul obtinut de subiecti se datoreaza testului si nu unor factori externi (variabile confundate).

Pentru a identifica itemii buni, autorul testului are la indemana atat metode statistice calitative, cat si cantitative.

De exemplu, o metoda calitativa de evaluare a itemilor unui test este aceea de a utiliza in administrarea testului metoda de rezolvare cu "voce tare". In acest context, examinatorul ii cere subiectului sa "gandeasca cu voce tare", sa exprime verbal ceea ce gandeste in timp ce rezolva fiecare item al testului. Daca testul este proiectat pentru a masura performanta, o astfel de verbalizare ajuta nu numai la identificarea interpretarilor gresite pe care subiectii le-au facut, ci si la identificarea cauzei acestor interpretari. La fel se pot identifica strategiile de rezolvare pe care le utilizeaza subiectul. Daca testul este proiectat sa masoare un anumit aspect al personalitatii, de exemplu managementul impresiei, o astfel de procedura poate oferi informatii valoroase despre modul in care subiectul - ca si membru al unui grup profesional - percepe, interpreteaza si raspunde la itemii chestionarului respectiv. O alta metoda calitativa frecvent utilizata, consta in dezbaterea cu un grup de asa-numiti experti a testului luat in totalitatea sa, discutia continuand apoi cu fiecare item in parte. Grupul de experti poate fi alcatuit din persoane carora li s-a aplicat testul sau din persoanele care l-au administrat, cotat sau interpretat, sau un grup de experti dintr-un anumit domeniu - apartenenta la grup poate fi determinata de interesele si obiectivele autorului testului.

Dupa ce a fost administrata prima forma a testului pe un grup reprezentativ de subiecti, autorul trebuie sa analizeze scorurile globale obtinute la test si raspunsurile pentru fiecare item in parte. Procedura statistica prin care se realizeaza acest lucru poarta denumirea de "analiza de itemi".

Analiza itemilor testului

Analiza de itemi este in prezent o practica curenta, ea avansand in complexitate si precizie odata cu largirea posibilitatilor de prelucrare statistica a datelor prin intermediul calculatoarelor si a unor soft-uri specializate pe aceasta problema.

Un item este analizat folosind una sau mai multe din urmatoarele prelucrari (Albu, 2000):

  • calculul frecventei cu care au fost alese raspunsurile si identificarea cauzelor care au determinat frecventele foarte mari sau foarte mici ale unor raspunsuri'
  • examinarea redactarii itemului pentru evidentierea termenilor ambigui, a absentei unor informatii necesare formularii unui raspuns corect si identificarea raspunsurilor neplauzibile (pe care nu le alege nimeni) sau evidente (pe care le aleg toti subiectii);
  • verificarea comportarii itemului vizavi de diverse criterii;
  • determinarea capacitatii itemului de a face deosebire intre examinatii care au nivel scazut si cei cu nivel ridicat la variabila masurata sau prognozata de test.

Vom prezenta in continuare procedurile utilizate, in mod obisnuit, de catre proiectantii de teste pentru a selecta itemii cei mai reprezentativi dintr-o baza initiala de itemi. Mentionam faptul ca criteriile de evaluare a unui item depind de obiectivele proiectantului testului. De pilda, un anumit autor poate considera ca itemii buni sunt cei care contribuie in mod optim la consistenta interna a testului, in timp ce un altul ar vrea sa proiecteze un test cu cea mai mare validitate fata de un anumit criteriu, selectand acei itemi care sa-l ajute sa-si atinga obiectivul sau. In continuare, vom avea in vedere urmatoarele procedee statistice care stau la baza analizei de itemi:

  • Indicele de dificultate al unui item
  • Indicele de validitate al unui item
  • Indicele de fidelitate al unui item
  • Indicele de discriminare al unui item
  • Curba caracteristica a itemului
  • Alte consideratii privind analiza de itemi

Indicele de dificultate al unui item

Calcului indicelui de dificultate al itemilor este se refera la frecventa relativa a persoanelor care au rezolvat corect un anumit item al unui test, din totalul celor carora li s-a administrat testul respectiv (Murphy & Davidshofer, 1991).

Indicele de dificultate al unui item se noteaza cu p. El reprezinta scorul mediu care se poate obtine la item daca s-ar acorda un punct pentru raspunsul corect si zero puncte pentru raspunsul gresit sau omis. p este intotdeauna cuprins intre 0 si 1. Daca 50 de subiecti din 100 au raspuns corect la itemul 2, atunci indicele de dificultate al itemului este de 50 impartit la 100, adica .5. Daca 75 dintre subiecti au raspuns corect la itemul 3, p va fi egal cu .75 si putem spune ca itemul 3 a fost mai usor decat itemul 2. Se poate observa ca, cu cat indicele de dificultate este mai mare, cu atat itemul este mai usor.

In calcul trebuie insa, luata in considerare si posibilitatea aparitiei efectului dat de ghicirea raspunsului corect mai ales atunci cand vorbim de itemii cu variante multiple de raspuns; in acest caz, dificultatea medie optima pentru un item este de obicei valoarea de mijloc intre 1.00 si proportia de succes datorata sansei. In cazul itemilor cu raspuns de tipul adevarat/fals, probabilitatea de a ghici raspunsul corect este de ½ sau .50. Prin urmare, dificultatea optima va fi valoarea de mijloc intre .50 si 1.00, adica .75. In general, valoarea de mijloc ce reprezinta dificultatea optima a itemului se obtine prin calcularea sumei dintre proportia ratei de a ghici raspunsul si 1.00, divizata cu 2:

Pentru un item cu cinci variante posibile de raspuns, probabilitatea de a ghici raspunsul corect este de 1/5 sau .20. Dificultatea optima a itemului este de .60:

Unele teste sunt administrate cu limita de timp si vor exista subiecti care nu le vor parcurge integral. In acest caz se recomanda ca la calculul frecventei relativ la p, pentru un anumit item, sa se utilizeze la numitor numarul acelor subiecti au raspuns la item si nu efectivul lotului caruia i s-a administrat testul. Pentru fiecare persoana vor fi considerate necitite toti itemii care se situeaza dupa ultimul item rezolvat.

Itemii a caror indice de dificultate ia valori cuprinse intre .3 si .7 se considera ca realizeaza o diferentiere buna intre subiecti.

Indicele de validitate al unui item

Pentru aprecierea validitatii itemilor se apeleaza la un criteriu extern care poate fi un alt test despre care stim ca prezice sau masoara acelasi lucru ca si testul analizat. In practica, operarea cu un criteriu extern este greu de realizat.

Indicele de validitate poate fi calculat doar daca se cunosc urmatoarele doua valori statistice:

Ø      abaterea standard a scorului la itemul in cauza

Ø      corelatia biseriala dintre scorul obtinut de subiect la item si scorul-criteriu.

Abaterea standard a scorului la itemul 1 (notata cu s1) poate fi calculata folosind indicele de dificultate a itemului (p1) dupa urmatoarea formula:

Corelatia biseriala intre scorul la itemul 1 si scorul-criteriu (notata cu ) este inmultita cu abaterea standard a itemului 1 (), rezultatul fiind un indice de validitate al itemului 1 (). Pentru calculul lui punct biserial se poate apela la formula din Capitolul 2.

Pentru a maximiza validitatea relativa la criteriu este indicat sa se utilizeze reprezentarea grafica a norului de puncte si sa se elimine manual acei itemi care fac nota discordanta cu obiectivul propus.

Indicele de fidelitate al unui item

Indicele de fidelitate a itemului este un indicator al consistentei interne a testului; cu cat acest indice este mai mare, cu atat consistenta interna a testului este mai buna. El este egal cu produsul dintre abaterea standard a itemului (s) si corelatia biseriala (r) dintre scorul la item si scorul total la test.

Analiza factoriala si consistenta interna a itemilor. O metoda statistica utila pentru a determina daca itemii unui test masoara acelasi lucru este analiza factoriala. Itemii care nu incarca pe factorul pentru care au fost construiti (adica, itemii care nu masoara ceea ce ar trebui sa masoare) pot fi revizuiti sau eliminati. Daca exista prea multi itemi care masoara acelasi lucru se pot elimina cei mai slabi dintre ei. Analiza factoriala poate folosi procesului de interpretare a testului, mai ales atunci cand se compara constelatia de raspunsuri la itemii a doua sau mai multe grupuri. De exemplu, daca un test de personalitate este administrat la doua grupuri de pacienti internati intr-o clinica de psihiatrie (fiecare grup avand un diagnostic diferit), se poate observa ca acesti itemi incarca factori diferiti, in functie de grup. Astfel, autorul testul sau chiar utilizatorul lui trebuie sa revizuiasca sau sa elimine anumiti itemi, sau sa mentioneze existenta acestor diferente in manualul testului.

Indicele de discriminare al unui item

Indicele de discriminare al unui item indica cat de bine discrimineaza itemul intre subiectii cu scoruri mari si cei cu scoruri mici, adica, puterea de discriminare a itemului. Astfel, un item cu variante multiple la un test de evaluare a performantei este un item bun daca: (1) majoritatea persoanelor cu scoruri mari la test au raspuns corect la itemul respectiv si (2) cei care au obtinut scoruri mici la test au raspuns gresit la acel item. Daca majoritatea celor care au obtinut scoruri mari au raspuns gresit la un item, atunci este posibil ca subiectii sa realizeze interpretari alternative ale raspunsurilor destinate a fi un distractor. In acest caz, autorul testului trebuie sa procedeze la un interviu cu subiectii pentru a identifica rationamentul utilizat pentru a raspunde, dupa care va revizui sau sau elimina itemii necorespunzatori.

Exista mai multe metode de a masura capacitatea de discriminare a itemilor, alegerea unei metode depinzand de natura datelor. Daca autorul testului vrea sa coreleze o variabila dihotomica cu o variabila continua, atunci corelatia biseriala reprezinta metoda cea mai adecvata. Insa, atunci cand variabila dihotomica a fost creata dintr-o distributie continua (ca de exemplu, rezultatul unui test de evaluare a performantelor la care pe baza raspunsurilor date a fost impartit in doua categorii: admis/respins) se recomanda utilizarea corelatiei biseriale. Daca se doreste masurarea relatiei dintre doua variabile dihotomice se foloseste coeficientul phi.

Indicele de discriminare este o masura a capacitatii de discriminare a itemilor reprezentat prin coeficientul D. Murphy si Davidshofer (1991) propun ca pentru calculul puterii de discriminare a unui item sa se foloseasca metoda grupelor contrastante. Metoda consta in alcatuirea a doua loturi de subiecti:

grupul subiectilor care au obtinut valori mari la variabila criteriu

Grupa care a obtinut valori mici la variabila criteriu

Se compara performanta la un anumit item cu performanta incadrata in partea superioara si inferioara a distributiei scorurilor. Adica, se vor lua in calcul scorurile cuprinse intre 27% din partea superioara si 27% din partea inferioara a distributiei de frecventa - cu conditia ca distributia sa fie normala. Pe masura ce distributia scorurilor devine mai plata, se abate de la legea normala, limitele optime ce definesc performantele mari si mici se largesc, apropiindu-se de 33% In general se accepta ca pentru majoritatea aplicatiilor, orice procentaj situat intre 25 si 33 este util.

Indicele de discriminare a itemilor este o masura a diferentei dintre proportia scorurilor corecte mari si proportia scorurilor mici clasificate ca raspunsuri incorecte. Cu cat valoarea lui D este mai mare, cu atat mai mare va fi si numarul scorurilor mari obtinute prin darea de raspunsuri corecte. O valoare negativa a lui D la un anumit item este un semnal de alarma pentru ca indica existenta situatiei in care subiectii cu scoruri mici la test ar putea raspunde corect la item intr-o proportie mai mare decat cei care obtin scoruri mari. Acesti itemi trebuie revizuiti sau eliminati.

Formula de calcul aplicabila fiecarui item este:

unde:

NB, NS = numarul de persoane din grupa buna, respectiv grupa slaba. In cazul ca testul a fost administrat cu limita de timp, NB, si NS reprezinta numarul celor care au parcurs itemul in cele doua grupe;

CB, CS = numarul persoanelor care au rezolvat itemul corect, in grupa buna, respectiv in grupa slaba.

Indicele de discriminare variaza intre -1 (cand toti cei din grupa slaba au rezolvat itemul corect si toti cei din grupa buna au gresit) si +1,(cand itemul a fost rezolvat corect de catre toti cei din grupa buna. Si gresit de catre cei din grupa slaba). Cu cat indicele de discriminare este mai mare, cu atat el reuseste sa diferentieze mai bine grupul 'bun' si grupul 'slab'.

Cand avem de-a face cu scoruri dihotomice, se face apel la un indice de discriminare adecvat cazurilor in care itemii admit scoruri formate din mai multe valori:

unde MB si MS reprezinta media scorurilor itemului in grupa buna, respectiv in aceea slaba.

Un exemplu (Murphy & Davidshofer, 1991). Un test format din mai 40 itemi a fost analizat de un grup de experti care au apreciat ca toti itemii masoara acelasi lucru. Testul a fost administrat unui lot de 100 studenti. 27 cu scoruri mari la test au format grupa buna, iar 27 cu scoruri mici la test, grupa slaba. S-a calculat frecventa relativa a celor care au raspuns corect la fiecare item al testului, in fiecare din cele doua grupe. Tabelul 5.1 prezinta rezultatele obtinute la patru din itemii testului.

Tabelul 5.1

Frecventa relativa a subiectilor care au raspuns corect la primii 4 itemi ai testului

Item

Grupa buna

Grupa slaba

D

Coloana D a Tabelului 5.1 ne indica faptul ca itemul 3 are o putere de discriminare slaba. Ele este aproape la fel de dificil pentru ambele grupe, nediferentiind intre grupa buna si slaba. Itemul 4 are putere mare de discriminare, dar cu semn negativ (itemul este usor pentru studentii cu performante slabe si dificil pentru cei cu performante bune. Probabil ca a aparut un viciu de formulare, acest item va trebui regandit..

Pentru mai multe detalii si explicatii critice asupra acestui subiect, a se vedea M. Albu (1998).

Curbele caracteristice itemilor sau teoria raspunsului la itemi

O reprezentare grafica a dificultatii itemilor si a gradului in care discrimineaza poate fi facuta printr-o curba caracteristica itemului (CCI). Asa cum se observa in figura 5-2, o astfel de curba este un grafic in care aptitudinea masurata este reprezentata pe axa orizontala, in timp ce probabilitatea raspunsului corect e reprezentata pe axa verticala. De remarcat este faptul ca masura in care un item discrimineaza intre subiectii cu scoruri mari si cei cu scoruri mici, este data de inclinatia curbei. Cu cat mai abrupta inclinatia, cu atat mai mult discrimineaza itemul respectiv. De asemenea, daca inclinatia este pozitiva, atunci mai multi subiecti cu scoruri mari raspund corect decat subiecti cu scoruri mici, iar reciproca este si ea valabila. Dar, sa ne concentram pe curba caracteristica itemului (a). Oare acest item putem sa consideram un item bun? Raspunsul este negativ; probabilitatea unui subiect de a raspunde corect - raspuns corect inseamna ceea ce e stabilit de cel ce a construit testul - este mare pentru subiecti cu aptitudini scazute si mica pentru subiectii cu aptitudini crescute. Ce putem afirma despre itemul (b); este el un item bun? Din nou, raspunsul este negativ. Curba ne spune ca subiectii cu aptitudini moderate vor avea cea mai mare probabilitate de a raspunde corect; subiectii cu aptitudini crescute, respectiv scazute vor avea probabilitate mai mica de a raspunde corect. Itemul (b) este unul din acei itemi pentru care daca gandesti prea mult, atunci e foarte probabil sa gresesti.

Itemul (c) este un item bun; observam ca probabilitatea de a raspunde corect creste odata cu aptitudinea subiectului. Ce putem zice de itemul (d)? Curba caracteristica itemului discrimineaza pentru un singur punct al continuumului aptitudinii, probabilitatea de a raspunde corect este foarte mare pentru toti subiectii care se situeaza deasupra acestui punct de pe axa aptitudinii. Un item ca (d) este foarte bun pentru un test, de exemplu, pentru a selecta candidatii in functie de un scor critic. Totusi acest item nu e foarte bun pentru a ne oferi informatii despre aptitudinile subiectului, la toate nivelele acestei aptitudini - cum ar putea fi cazul unui diagnostic sau test de aptitudini matematice.

Modelul trasaturilor latente Un test sau chestionar este construit pentru a estima nivelul unor cunostinte sau aptitudini ori a unor trasaturi de personalitate ale unui individ. Variabila de care depinde performanta la test, fie ea de cunostinte, aptitudini, trasaturi de personalitate sau altceva, nu este direct masurabila. Printr-un test se obtine doar o estimare a valorii variabilei. Conform modelului trasaturilor latente, aceasta variabila neobservabila, care sta la baza oricarei masurari psihometrice este considerata latenta. Ea este una unidimensionala. Se presupune ca toti itemii testului masoara o anumita trasatura de personalitate, gradul in care fiecare item indeplineste acest obiectiv este dat de curba caracteristica a itemului. In contrast cu teoria clasica a "scorului adevarat" in care nu se fac presupuneri despre distributia de frecventa a scorurilor la test, teoria trasaturilor latente avanseaza idei referitoare la probabilitatea de aparitie a scorurilor observate obtinute de subiecti si scorurile adevarate. Teoriile trasaturilor latente propun modele care descriu cum aceasta trasatura latenta influenteaza performanta aferenta fiecarui item al testului. Spre deosebire de scorurile la test sau scorurile adevarate, scorurile latente pot sa ia valori de la +¥ la -¥


Aplicabilitatea modelului trasaturilor latente la testele psihologice a fost pusa la indoiala de cativa teoreticieni. S-a sustinut, de exemplu, ca unidimensionalitatea testelor ar fi violata daca avem in vedere testele psihologice. S-a sustinut si ca acelasi item al unui test psihologic poate sa masoare abilitati sau aptitudini diferite ale subiectilor, in functie de experientele de viata ale acestora. Desi are unele limite firesti, modelul trasaturilor latente pare sa joace un rol din ce in ce mai important in crearea si dezvoltarea noilor teste si programe de testare.

Precizari utile

"Ghicirea" raspunsurilor la teste, indiferent de natura lor, nu este privita ca o problema. In domeniul testarii s-au incercat diferite solutii de estompare a fenomenului ghicirii, mai ales la testele cu raspunsuri la alegere. Totusi ghicirea ramane un fapt. In fata unui test, mai ales de performanta, subiectii sunt pusi frecvent in situatia sa ghiceasca raspunsul corect. S-au incercat o serie de solutii de a evita ghicirea, dar rezultatele nu au fost edificatoare. Astfel, pe langa interventiile la nivelul scorurilor prin utilizarea "corectiilor pentru ghicire", s-au propus si unele interventii la nivelul instructiunilor pe care le primesc subiectii De pilda, subiectii primesc instructiuni de a nu omite nici un item si de a nu ghici atunci cand au indoieli. Deocamdata nu exista solutii satisfacatoare pentru a rezolva aceasta problema. Cel care a construit testul previne problema prin includerea in manualul testului de 1) instructiuni explicite care sa fie transmise subiectilor si 2) instructiuni care sa vizeze itemii omisi de subiecti.

Corectitudinea itemilor. Curbele caracteristice itemilor ne ofera o modalitate de a identifica care dintre itemi sunt corecti si care sunt distorsionati. Daca un item e considerat corect de doua sau mai multe grupuri de subiecti (care difera ca si grup in functie de caracteristici de rasa, sex sau varsta) atunci curba caracteristica lui nu ar trebui sa fie semnificativ diferita intre grupuri. Invers, daca un item are curbe semnificativ diferite pentru un grup fata de altul - grupurile fiind diferite doar in ceea ce priveste caracteristicilor irelevante ale testului - atunci acel item e distorsionat.

Justificarea acestui criteriu al ICC in ceea ce priveste distorsionarea itemilor este aceea ca orice persoana care manifesta aceeasi abilitate masurata de testul integral,ar trebui sa aiba aceeasi probabilitate de a marca orice item corespunzator abilitatii respective, independent de rasa, clasa sociala, sex sau alte caracteristici. Cu alte cuvinte, aceeasi proportie de persoane din fiecare grup ar trebui sa marcheze orice item al testului, avand in vedere ca toti au obtinut acelasi scor general.

O identificare statistica a itemului distorsionat necesita utilizarea unei masuratori adecvate a ipotezei nule, aceea prin care se sustine ca nu exista diferente intre curbele caracteristice itemilor pentru doua grupuri diferite. Itemii care inregistreaza diferente semnificative in ceea ce priveste curbele caracteristice ar trebui sa fie eliminati sau revizuiti. Daca un numar relativ mare de itemi distorsioneaza in favoarea unui grup vor exista un numar relativ egal de itemi care vor distorsiona in favoarea altui grup. In acest caz, nu se poate sustine ca testul ar masura aceeasi aptitudine in cele doua grupuri, chiar daca scorurile globale la test sunt aproximativ egale.

Analiza curbelor caracteristice itemilor reprezinta doar o modalitate de a observa distorsiunile existente la nivelul itemilor testului. In acest sens au fost realizate o serie de studii de evaluare diferitelor metode de detectare a distorsiunilor itemilor intre grupe diferite, incluzand diferentele existente in dificultatea itemilor, discriminarea, curbele caracteristice ale itemilor si distributia raspunsurilor incorecte. Aceste cercetari au ajuns la concluzia ca alegerea metodei de analiza a itemilor este aceea care afecteaza intr-adevar distorsionarea acestora.

Teste de viteza. Analiza de itemi a testelor care se administreaza cu limita de timp creeaza numeroase probleme datorita inmultirii rezultatelor neinterpretabile sau gresite datorate in mare parte faptului ca itemii dinspre finalul testului nu pot fi rezolvati de catre toti subiectii, fiind astfel perceputi ca mai dificili. Chiar si itemii ceilalti pot fi afectati de erori nu de rezolvare ci datorate lucrului sub presiune. Itemii care apar la sfarsit intr-un test cu limita de timp este mai probabil sa aiba o corelatie item-total pozitiva, pentru ca ei sunt abordati de un grup selectionat de subiecti. O solutie ar fi aceea sa restrangem analiza itemilor doar la acei itemi completati de subiecti. Totusi, aceasta solutie nu se recomanda din cel putin trei motive: (1) analiza itemilor din ultimele pozitii se va face pe un numar din ce in ce mai mic de subiecti, ducand la rezultate neconsistente (2) daca subiectii cu mai multe cunostinte ajung la sfarsitul testului, atunci parte din analiza se face pe tot esantionul, iar parte se face pe un esantion deja selectionat si (3) pentru ca subiectii cu mai multe cunostinte sau cu aptitudini mai dezvoltate vor ajunge la sfarsitul testului presupuandu-se ca il vor rezolva mai bine, atunci este foarte probabil sa ajungem la concluzia ca ultimii itemi sunt mai usor de rezolvat decat ceilalti itemi.

Proiectantului unui test i se poate face recomandarea ca daca limita de timp nu este o componenta a aptitudinii masurate de test iar aceasta poate cauza obtinerea de informatii distorsionate asupra performantelor, este indicat ca cel care a construit testul sa lase suficient timp pentru rezolvarea testului cu scopul de a evita acest efect.

Revizuirea testului si redactarea formei finale

Un test psihologic sau de cunostinte odata experimentat, se va putea proceda la revizuirea sa in vederea redactarii formei finale. Autorul sau proiectantul testului isi va concentra activitatea asupra bancii de itemi care a fost supusa actiunii de analiza de itemi. In primul rand, el va elimina din banca de itemi pe aceia care s-au dovedit a fi nerelevanti. Tot cu aceasta ocazie se fac si indreptarile legate de reformularea unor itemi, de adaptarea lor nivelului cultural al celor carora li se adreseaza testul respectiv. Rezultatul acestei actiuni va fi obtinerea unui test care masoara mai bine obiectivele formulate de proiectantul testului in termeni de dificultate a itemului, discriminarea itemului, consistenta itemilor si validitatea lor. Urmatorul demers in evolutia testului va fi aplicarea unei versiuni revizuite in conditii standardizate populatiei tinta. Pe baza unei analize de itemi efectuate pe datele obtinute de la aceasta experimentare, cel care a proiectat testul il poate finisa si redacta forma sa finala. Daca datele colectionate indica faptul ca testul nu este intr-o forma finala, se reiau procesele de revizuire si analiza itemilor.

La acest moment final, proiectantul se va concentra asupra validitatii de aspect a testului, a sistemului de completare a acestuia si cel de corectare.

Un test este acceptat cu mai multa usurinta de catre subiecti daca are validitate de aspect. Desigur, acest atribut se are in vedere inca din momentul initial de proiectare in sensul ca nu ne vom prezenta la niste mecanici de locomotiva cu itemi de test care sa includa elemente de aplicare a legilor parghiilor utilizand unelte din agricultura. Dar, in afara de acest lucru, un design al testului se impune. Redactarea acestuia pe un suport de hartie de calitate cu instructiuni de lucru exprimate clar, este una din primele conditii ale redactarii variantei finale a testului. Chiar insistam asupra formularii instructiunilor de lucru. Acestea trebuie sa contina pe scurt obiectivul testului, date despre confidentialitatea rezultatelor, conditiile de introducere si pastrare a rezultatelor intr-o baza de date sau renuntarea la acest lucru. Daca este cazul se va face referire la problemele respectarii drepturilor omului, la diferentele de sex si rasa.

Sistemul de cotare a testului este si acesta un aspect important. In prezent se obisnuieste ca scorarea sa fie efectuata direct pe foaia de raspuns a testului, pe verso indicandu-se scorurile corecte. Astfel, subiectul isi poate examina singur performanta obtinuta. Testele si chestionarele de personalitate sunt adesea prezentate pe calculator sau, exista numeroase variante pe internet. In acest caz, corectarea si feedback-ul au loc aproape instantaneu, subiectul intrand in posesia performantei realizate, a profilului psihologic si chiar a unei caracterizari imediat dupa completarea testului sau chestionarului respectiv.

Toate aceste interventii, caracteristice acestei faze de elaborare a testului, necesita multa munca si creativitate din partea proiectantului.

Studii de validare si etalonare

Procesul de elaborare a unui test sau chestionar de personalitate continua prin dezvoltarea unor studii care privesc atat testul/chestionarul in sine, dar si utilizarea acestuia in practica. Procedurile utilizate se refera la actiuni de validare si la culegerea in continuare de date pentru elaborarea unor norme de interpretare generale si sau specifice.

In ceea ce priveste continuarea validarii itemilor testului, se utilizeaza frecvent tehnica validarii incrucisate (cross validation). Validarea incrucisata se refera la reluarea procesului de validare testului pe un lot de subiecti, altul decat cel care a participat la construirea propriu-zisa a testului. In mod normal, ne asteptam ca itemii selectionati in versiunea finala a testului (in parte din cauza unei corelatii cu criteriul) vor avea scoruri de validitate mai mici cand acestia sunt administrati unui alt lot de subiecti - aceasta din cauza factorilor care tin de sansa. Scaderea constanta in validitate dupa validarea incrucisata se numeste reducerea/minimizarea validitatii ("validity shrinkage"). Aceasta scadere este de asteptat si este privita ca o parte integranta a procesului de constructie a testului. Pe de alta parte, o astfel de diminuare este preferabila unui scenariu in care validitatea mare a itemilor este publicata in manualul testului ca rezultat al utilizarii inadecvate a unor esantioane identice utilizate la standardizarea si validarea incrucisata.

Un test sau chestionar, dupa ce a fost construit, va fi studiat cum se va comporta in practica. Astfel, el poate fi folosit in multe scopuri, evaluare scolara, orientare scolara si profesionala, selectie de personal etc. In toate aceste contexte se impune initierea unor studii de validitate prin raportarea la unul sau mai multe criterii externe. De fapt, aceste studii vor da utilizatorului testului reperele necesare evaluarii calitatilor pe care testul in cauza le poseda. Aceste date vor fi luate in considerare atunci cand utilizatorul testului va dezvolta o procedura de interventie cu testul respectiv.

Redactarea manualului testului

Toate datele despre constructia testului vor fi cuprinse in asa-numitul manual al testului. Desigur, nu exista o restrictie precisa a ceea ce trebuie sa contina sau nu manualul testului. Totusi, el trebuie sa aiba cateva capitole necesare utilizarii testului respectiv.

Orice manual al unui test sau chestionar psihologic va debuta cu o parte care se refera la teoria pe care se bazeaza constructia probei respective, la o sistematizare bibliografica legata de aceasta teorie. Acest lucru este necesar deoarece utilizatorul testului trebuie avertizat asupra a ce calitati trebuie sa intruneasca testul, care sunt obiectivele pe care acesta le evidentiaza, ce studii s-au mai facut in testarea teoriei respective etc.

Al doilea capitol al manualului este destinat modului de administrare si cotare a testului. Aici vor fi incluse in detaliu instructiunile de administrare ale probei. Va fi apoi explicata maniera in care se face cotarea (manual sau prin intermediul calculatorului).

Capitolul al treilea va fi dedicat modului de interpretare a testului sau chestionarului. In acest caz vor fi introduse rezultatele obtinute cu ocazia constructiei probei respective. Se vor da unele date interpretative generale si strategiile de interpretare. Cand avem de-a face cu chestionare de personalitate de genul 16PF sau CPI, sunt date descrierile scalelor cu semnificatia cotelor mari si mici, corelatia factorilor intre ei si cu alte scale de la alte chestionare etc. Toate aceste date trebuie sa puna utilizatorul probei cu detaliile si demersurile interpretative.

Uneori avem de-a face cu revizuiri ale probei sau cu versiuni diferite ale acesteia. In aceasta situatie, un capitol separat va fi destinat explicarii completarilor aduse si, bineinteles, avantajelor aduse de noua versiune. Fireste, vor fi incluse toate procedurile statistice pe care autorul le-a efectuat cu versiunea noua.

Un capitol separat va fi dedicat studiilor de fidelitate si validitate a testului. Acest capitol este unul foarte important. Tot aici vor fi incluse, alaturi de studiile care privesc analiza de itemi si cele realizate in scopul determinarii fidelitatii generale a probei si a validitatii sale in diferite contexte.

Ultimul capitol poate fi dedicat modului de comunicare a rezultatelor la test, redactarii raportului final.

In anexe se dau normele de interpretare

Pentru detalii asupra continutului manualului testului se poate consulta: H.D. Pitariu (2002); 16PF editia a cincea. Manualul testului. Cluj-Napoca: ASCR.

BIBLIOGRAFIE

Albu. M. (1998). Construirea si utilizarea testelor psihologice. Cluj-Napoca: Clusium.

Albu, M. (2000): Metode si instrumente de evaluare in psihologie. Cluj-Napoca: Argonaut.

Cohen, R.J., Montague, P., Nathanson, L.S., Swerdlik, M.E. (1988). Psychological testing. An introduction to tests & measurement. Mountain View: Mayfield Publishing Company.

Guion, R.M. (1984). On the concept of individual differences. Paper presented at the XIXth International Congress of Psychology. Acapulco, September.

Murphy, K.R. & Davidshofer, Ch.O. (1991). Psychological testing. Principles and applications.New Jersey: Prentice-Hall International, Inc.

Pitariu, H.D. (2000). Managementul resurselor umane. Evaluarea performantelor profesionale. Bucuresti: All/Beck.

Pitariu, H.D. (2002); 16PF editia a cincea. Manualul testului. Cluj-Napoca: ASCR



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 6313
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved