CATEGORII DOCUMENTE |
Gradinita |
TEORIA SI METODOLOGIA EVALUARII
CONCEPTE FUNDAMENTALE ALE EVALUARII
Masurarea
In general, masurarea consta in realizarea unei corespondente intre elementele a doua multimi, dintre care una este o multime de numere, iar cea de a doua o multime de indivizi, atribute, abilitati, atitudini sau alte tipuri de caracteristici sau calitati masurabile. Proce-durile de realizarea a corespondentei sunt extrem de precis definite, fiind, de regula, concretizate intr-un instrument de masura. Testele educationale sunt instrumente reprezentative pentru acest tip de demers, in special atunci cand vorbim despre teste obiective.
Aprecierea
In acest caz, alocarea de valori numerice sau calificative se realizeaza pe baza unor criterii, precis identificabile, dar relativ independente de un instrument. Chiar daca sunt utilizate instrumente, cum ar fi ghidurile de observatie sau de interviu, sau diferite tipuri de probe de performanta integrative, aprecierea este rezultatul unei secvente a demersului care este ulterioara aplicarii instrumentului.
Exemple ale acestui tip de demers evaluativ sunt inspectia scolara, activitatile complexe desfasurate de institutii specializate pentru evaluarea calitatii invatamantului sau pentru acreditarea unor programe de studii sau institutii, ca si testele educationale subiective, probele orale sau practice utilizate pentru apreciere curenta sau pentru examinare.
Judecata experta
In cazul acestui demers evaluativ, emiterea de judecati se reali-zeaza in legatura cu aspecte de extrema complexitate si in legatura cu care, de regula, nu exista o teorie sau o viziune unanim acceptata asupra criteriilor utilizabile. Purtatorii criteriilor sunt expertii. Judecata experta isi arata utilitatea si in situatia in care nu exista timpul, resursele sau posibilitatea conceptuala sau tehnica de a colecta date menite sa fundamenteze evaluarea.
Sunt utilizate, in acest sens, o serie de tehnici, cum ar fi interviul, check-list, tehnica Delphy, tehnica Remiss, tehnica grupurilor de referinta.
Teste educationale
Sintagma teste educationale este folosita pentru a desemna un intreg ansamblu diversificat de probe, realizate in conditii de tehnici-tate in masura sa le asigure validitate si fidelitate, prin care se urma-reste, in general, evidentierea efectelor induse asupra populatiei scolare (sau implicate in alte programe de pregatire) prin expunerea acesteia la influentele unor continuturi, evenimente, contexte si resurse educa-tionale, sau evidentierea unor caracteristici semnificative din punctul de vedere al invatarii (ex.: nivel de dezvoltare cognitiva, atitudini, aptitudini sau abilitati).
Foarte frecvent, cel putin pana la ora actuala, testele educatio-nale vizeaza modificarile introduse de invatare in domeniul cognitiv. Pentru a desemna acest tip de teste educationale, vom utiliza sintagma teste de cunostinte. Pe langa acestea, in categoria testelor educationale sunt incluse testele de abilitati intelectuale si psiho-motrice, scalele de atitudini, ca si chestionarele de opinie, prin care se colecteaza informatii despre asemenea elemente, cum ar fi caracteristicile activitatii cadrelor didactice sau motivatia elevilor sau studentilor.
TIPOLOGIA TESTELOR DE CUNOSTINTE
Criteriul specificitate: teste integrative si punctuale
"Testele" utilizate in etapa "prestiintifica" a verificarii cunos-tintelor, fie acestea orale sau scrise, se caracterizau prin aspectul integrativ al solicitarilor si raspunsurilor.
Solicitari de tipul "Revolutia de la 1848 in Tara Romaneasca", "Analiza literara a poemului Luceafarul", "Principiile termodinamicii", "Pancreasul", "Sistemul circulator limfatic", "O zi pe malul marii" (compunere in limba straina) sau "Sa se demonstreze ca functiaetc." fac parte din aceasta categorie si, in esenta, nu sunt prin nimic deosebite de tipurile de probe la care au fost supusi elevii de cand exista scoli ca organizatii sociale specializate. Formularea raspunsurilor se realizeaza prin mobilizarea unor cunostinte si abilitati care se exteriorizeaza in structuri integrate.
Faza "stiintifica" in elaborarea testelor de cunostinte este rezul-tatul unui demers analitic de specificare a aspectelor concrete de masurat.
Testele apartinand acestei "a doua generatii" vor fi punctuale (discrete-point): fiecare element de test va masura un element cognitiv izolat, precis delimitat. Acoperirea unui domeniu de continut va solicita prezenta in cadrul testului a unui numar ridicat de elemente de test sau itemi.
Diferenta dintre testele integrative si testele punctuale este deci aceea ca primele sunt compuse din unul sau mai multi itemi, care abordeaza fiecare un complex de cunostinte si abilitati cognitive, pe cand cele din urma sunt compuse din numerosi itemi, care abordeaza cate un singur aspect izolat din domeniul supus testarii.
Testele actuale, din "generatia a treia", incearca sa reintroduca unele elemente de tip integrativ, pe de o parte, pentru a apropia situatia de testare de configuratia situatiilor si solicitarilor din viata profe-sionala si sociala, iar pe de alta parte, pentru a aborda convenabil obiective apartinand nivelurilor cognitive superioare.
Criteriul obiectivitate: teste obiective si subiective
Limbajul curent actual asociaza conotatii valorice sintagmelor "obiectiv" si "subiectiv", atunci cand acestea sunt utilizate in legatura cu testarea educationala: un test educational este "bun" daca este "obiectiv" si "necorespunzator" daca este "subiectiv". Tehnic vorbind, conotatiile mentionate sunt nu doar lipsite de semnificatie, dar chiar daunatoare, "obiectivitatea" unui test fiind legata in special de cotarea acestuia, respectiv de stabilitatea rezultatelor in cazul cotarii testului de evaluatori diferiti.
Un test "obiectiv" este un test compus din itemi care pot fi cotati prin compararea raspunsului cu un model complet al raspunsului corect. In acest caz, este eliminata influenta judecatii subiective a evalua-torului in cotare, aceasta putandu-se realiza chiar cu mijloace mecanice sau informatice.
In cazul unei proiectari judicioase, testele obiective pot fi carac-terizate prin coeficienti de fidelitate ridicati.
Testele punctuale sunt de cele mai multe ori si obiective, elabo-rarea unui model complet al raspunsului corect pentru fiecare item fiind facilitata de faptul ca fiecare dintre acestia abordeaza o zona de continut limitata sau un singur element de ordin cognitiv.
Un test subiectiv este constituit din itemi a caror cotare nu se poate realiza pe baza unor modele complete ale raspunsurilor corecte, opiniile, criteriile si judecatile evaluatorului fiind deosebit de impor-tante. Este de mentionat ca, mai ales pentru nivelurile superioare ale domeniului cognitiv, nu este nici posibil, nici de dorit incercarea de a se elabora modele complete ale raspunsurilor corecte.
In cazul testelor subiective, exista o probabilitate ridicata ca mai multi evaluatori sa coteze diferit raspunsurile, scorurile totale obtinute prezentand variatii importante.
Testele subiective vor tinde sa se caracterizeze printr-o redusa fidelitate, motiv pentru care, in practica actuala, utilizarea lor este precedata de stagii de pregatire a evaluatorilor, cu acordarea unei atentii speciale listelor de descriptori utilizate la cotare.
Criteriul utilitate: diagnostic, succes educational, plasament, capacitate
Testul diagnostic (formativ)
Este orientat selectiv catre zone determinate ale unui continut deja parcurs. Intrebarile la care acesta este chemat sa raspunda sunt legate de eficienta procesului de predare/invatare, de progresele realizate de subiecti consecutiv parcurgerii continutului, de zonele in care se manifesta deficiente, astfel incat sa se poata aduce corectii strategiilor didactice sau alocarii resurselor de instruire.
Testul diagnostic, uneori denumit de progres sau formativ, nu urmareste sa ierarhizeze subiectii. Fidelitatea testului nu este deci o variabila critica, insa asigurarea unei validitati satisfacatoare este necesara.
Cadrele didactice pot elabora si utiliza cu bune rezultate teste diagnostic.
Testul de succes educational (sumativ)
Este orientat neselectiv catre un continut deja parcurs, intr-o perioada de timp de durata semnificativa, de exemplu un an sau un intreg ciclu de invatamant (la una, uneori chiar la mai multe discipline).
Intrebarile la care este chemat sa raspunda un asemenea test, uneori denumit si sumativ, sunt legate de nivelul insusirii intregului, atingerii tuturor obiectivelor stabilite pentru domeniul de continut supus testarii. In unele tari, asemenea teste sunt efectiv utilizate in cadrul examenelor la finele anului de invatamant sau in cadrul examenelor de absolvire.
Ierarhizarea subiectilor este importanta pentru acest tip de test, motiv pentru care atat validitatea, cat si fidelitatea testului vor fi avute in vedere si evaluate inainte de utilizare.
Datorita importantelor resurse materiale si de competenta pe care le presupune realizarea unui bun test de succes educational, este recomandabil ca profesorii sa apeleze la instrumente realizate de grupuri de specialisti sau de organizatii competente.
Testul de plasament
Se utilizeaza pentru repartizarea subiectilor in grupe de nivel; de exemplu, in cazul in care profesorul doreste sa adopte strategii diferentiate de predare/invatare.
Intrucat ierarhizarea riguroasa a subiectilor nu este deosebit de importanta (ei urmand a fi repartizati in grupe relativ omogene, cu posibilitatea efectuarii ulterioare a corectiilor devenite necesare), iar rezultatele testarii sunt asteptate intr-un interval de timp cat mai redus, pentru a permite inceperea instruirii, testul de plasament este de obicei scurt, compus din itemi obiectivi, iar preocuparea proiectantului pentru economicitate prevaleaza asupra preocuparii pentru validitate si fidelitate.
Cadrele didactice pot proiecta si utiliza in mod curent teste de plasament.
Testul de capacitate (proficiency)
Este orientat catre cerinte considerate esentiale pentru o activi-tate viitoare, fie aceasta profesionala, sociala sau chiar de invatare. Proiectantul testului nu isi pune problema la ce continuturi sau evenimente de instruire au fost expusi subiectii in trecut, putand chiar fi in totala necunostinta de cauza in legatura cu acest aspect.
Un bun exemplu in acest sens il constituie testul TOEFL (Test of English as a Foreign Language), utilizat in cadrul procedurilor de selectie a candidatilor straini ce doresc sa frecventeze institutii de invatamant superior in Statele Unite: proiectantii nu sunt interesati de durata sau de modalitatile concrete in care a fost studiata limba engleza de catre candidati, ci doar de prezenta sau absenta cunostintelor si abilitatilor necesare utilizarii limbii la nivelul de performanta dorit.
Ierarhizarea candidatilor constituie o finalitate relevanta pentru un test de capacitate, motiv pentru care se va acorda o atentie speciala asigurarii unei bune validitati si fidelitati.
Grupurile de experti si organizatiile specializate vor fi avantajate in proiectarea unor teste de capacitate de reala calitate si utilitate.
CALITATI
METROLOGICE ALE TESTELOR
DE CUNOSTINTE
Validitatea
In general, validitatea reprezinta capacitatea testului de a masura efectiv ceea ce autorul testului a dorit ca acesta sa masoare.
Desi este probabil ca majoritatea autorilor de teste sa considere de la sine inteles ca testul masoara aspectele avute in vedere la proiectare, aceasta nu se intampla intotdeauna.
Validitatea de construct
Un test prezinta validitate de construct daca are la baza definitii explicite, pertinente si relevante ale aspectelor pe care isi propune sa le masoare; este, de asemenea, important ca autorul sa porneasca de la un punct de vedere asupra testarii concordant cu cele din literatura de specialitate si, atunci cand este necesar (ceea ce constituie majoritatea cazurilor), cu o teorie a invatarii.
Dupa cum este evident ca nu se poate construi un test de inteligenta fara sa stim ce este inteligenta, sau un test de atitudini in lipsa unor solide cunostinte teoretice despre acestea, tot astfel nu putem aspira sa proiectam un test care sa abordeze prin diferitele componente ale sale niveluri ale domeniului cognitiv, cum ar fi intele-gerea sau aplicarea, fara a porni de la definitii clare, operationale, ale acestor domenii.
Estimarea validitatii de construct se realizeaza in general prin judecata experta.
Validitatea de continut
Un test de cunostinte reprezinta validitate de continut daca acopera uniform si consistent continuturile avute in vedere.
In cazul in care testul urmareste sa masoare nivelul insusirii unor cunostinte predate, este necesar sa se testeze interiorizarea unui esantion reprezentativ al acestora, acoperind uniform atat diferitele domenii sau subdiviziuni ale continutului, cat si diferitele niveluri de complexitate ale domeniului cognitiv.
Aceeasi cerinta va trebui avuta in vedere si in cazul in care testarea se situeaza pe o pozitie anticipativa, urmarind existenta unor cunostinte necesare in situatii viitoare, ulterioare invatarii.
Estimarea validitatii de continut a unui test se realizeaza in general prin judecata experta.
Validitatea concurenta
Un test de cunostinte prezinta validitate concurenta daca rezul-tatele sale concorda cu rezultatele obtinute de aceiasi subiecti la alte probe, despre care se cunoaste ca masoara aceleasi rezultate sau tipuri de rezultate de invatare.
Validitatea concurenta poate fi estimata utilizandu-se calcule de corelatie intre rezultatele de la testul avut in vedere si rezultatele obtinute de aceiasi subiecti la un test de referinta.
Validitatea predictiva
Un test de cunostinte prezinta validitate predictiva in cazul in care rezultatele obtinute la test coreleaza cu performantele obtinute in invatare (daca testul este aplicat inaintea unui ciclu sau secvente de invatare) sau ulterior invatarii (daca testul este aplicat la sfarsitul unui ciclu sau secvente).
Spre a exemplifica, daca rezultatele la un test utilizat la un examen de admitere constituie un bun predictor pentru rezultatele la un test utilizat in cadrul examenului de absolvire, atunci se poate aprecia ca primul test este caracterizat de acest tip de validitate in raport cu cel de al doilea.
Validitatea predictiva a unui test poate fi exprimata cifric prin coeficienti de corelatie.
Validitatea de fatada (face validity)
Anumite caracteristici ale testului pot crea o imagine asupra validitatii acestuia, nu in mod necesar legata direct de validitatea sa reala.
De exemplu, acceptarea cvasiunanima a paradigmei de unifor-mitate a invatarii (distribuirea uniforma a eforturilor si performantelor de invatare pe toate componentele continutului testat) poate inca sa favorizeze considerarea ca valide a unor "teste" continand patru sau cinci intrebari, considerate "reprezentative" pentru intreg continutul predat intr-un ciclu de invatamant la o anumita disciplina.
Utilizarea unor facilitati moderne, cum ar fi dispozitivele de inregistrare video sau calculatoarele personale, pot, de asemenea, conferi validitatea de fatada unor teste de slaba calitate.
Estimarea validitatii de fatada a unui test se realizeaza de obicei prin judecata experta.
Factori care pot afecta validitatea unui test
Bunele intentii si credinta sincera a autorilor de teste in validitatea instrumentelor proiectate nu constituie in nici un caz garantii ale realizarii efective a acestui deziderat. Mult mai productiva poate fi luarea in consideratie a existentei si actiunii a numerosi factori care tind sa determine ca testul in ansamblu sau anumite sectiuni ale sale: a) sa masoare alte aspecte decat cele intentionate; b) sa masoare si alte aspecte pe langa cele intentionate.
Printre factorii mai frecvent mentionati, care pot fi utilizati si ca elemente ale unei liste de prezente si absente (check-list) pentru evaluarea unui test prin judecata experta, sunt de retinut urmatorii:
Claritatea instructiunilor
Instructiunile premergatoare testarii vor fi deosebit de explicite si clare, asigurand subiectului toate informatiile necesare intelegerii modului cum trebuie sa procedeze pentru a raspunde, cum sa-si formuleze si sa-si inscrie raspunsurile, ce trebuie sa faca in cazul in care nu cunoaste un raspuns, cat timp are la dispozitie, daca este permis raspunsul prin "ghicire". Instructiunile pot furniza si alte informatii, in functie de tehnicile de testare folosite.
In cazul in care acestea sunt insuficiente sau neclare, rezultatele la un test de cunostinte vor putea fi influentate de factori ca inteligenta generala sau inteligenta verbala, neincluse in obiectivele testarii.
Vocabularul si complexitatea structurilor de comunicare
Utilizarea unui vocabular excesiv de specializat, a unor fraze cu structura deosebit de complexa, a unor forme de reprezentare grafica nefamiliare subiectilor poate, de asemenea, influenta validitatea testului in sens negativ, contaminand rezultatele prin masurarea unor variabile parazite, ca inteligenta verbala, reprezentarea spatiala, inteligenta generala.
Nivelul de dificultate al elementelor testului
Este evident ca elementele de test (itemi) la care toti subiectii raspund corect, sau la care nici un subiect nu raspunde corect, sunt de redusa utilitate in economia testului si ca prezenta in numar ridicat a unor asemenea elemente va tinde sa reduca validitatea.
Constructia elementelor de test
Elementele de test pot contine, neintentionat, indicii care sa ghideze subiectul in producerea sau selectionarea raspunsului corect. Deseori, lungimea raspunsului se constituie ca un asemenea indiciu.
Ambiguitatea
Ambiguitatea instructiunilor sau a enunturilor ori solicitarilor prezente in elementele de test influenteaza negativ validitatea, conducand la confuzii sau interpretari gresite. Unii autori remarca tendinta ambi-guitatii de a dezorienta mai ales pe subiectii mai bine pregatiti, producand o "discriminare negativa".
Adecvarea elementelor de test la performantele
cognitive masurate
Anumite tipuri de elemente de test (itemi) sunt mai potrivite pentru abordarea unor niveluri specifice ale domeniului cognitiv. Spre exemplu, elementele de test de tip raspuns scurt sunt utile in testarea cunoasterii unor elemente de continut punctuale, pe cand utilizarea lor pentru abordarea unor niveluri, ca analiza, sinteza sau evaluarea, va avea efecte negative asupra validitatii.
Lungimea testului
Elementele (itemii) testului reprezinta in fond un esantion dintr-un univers de elemente, ce ar acoperi, la modul ideal, totalitatea obiec-tivelor si elementelor de continut supuse testarii. Cu cat un test este mai lung, cu atat probabilitatea ca acesta sa fie valid creste.
Aranjarea elementelor de test
Aranjarea optima este aceea care plaseaza elementele cel mai putin dificile la inceput, dificultatea elementelor crescand gradual.
Acest aranjament evita cel putin doua fenomene negative in raport cu validitatea: 1. blocarea unui subiect mai putin pregatit la un element dificil plasat in prima parte a testului, cu consecinta rezolvarii unui numar mai mic de elemente fata de numarul rezolvabil in cazul unui aranjament convenabil; 2. perturbatiile emotionale si motivationale produse de plasarea unor elemente dificile la inceputul testului.
Pozitionarea alternativelor de raspuns corecte
In cazul utilizarii unor elemente de test de tipul alegerii duale (adevarat/fals) sau alegerii multiple, plasarea raspunsurilor corecte conform unor reguli identificabile poate facilita "ghicirea" acestora.
De exemplu, daca utilizam alegerea multipla cu un singur raspuns corect din patru alternative, plasarea acestuia mai intai pe primul loc, apoi pe al doilea, apoi pe al treilea etc. poate fi sesizata relativ usor.
Procesul de predare-invatare
Modul in care fiecare element de test "functioneaza" este influentat nu numai de factorii deja mentionati, ci si de evenimentele si situatiile de invatare anterioare testarii. De exemplu, rezolvarea unei probleme nu va constitui in mod necesar dovada realizarii unui obiectiv cognitiv de nivel superior, in cazul in care rezolvarea problemei respective sau a unora similare a fost exersata la clasa.
Administrarea si cotarea testului
Respectarea sau nerespectarea instructiunilor de administrare si a limitelor de timp stabilite (pentru testele standardizate), alocarea unor intervale de timp prea mici, acordarea de asistenta neautorizata unor subiecti, permiterea comunicarii intre subiecti, cotarea corecta sau incorecta, cu erori, a testelor, inconsistenta cotarii pentru testele de tip eseu, iata tot atatia factori care pot influenta validitatea unui test.
Factori individuali
Pe langa factorii individuali emotionali si motivationali deja mentionati, care pot fi in general controlati prin claritatea si unifor-mitatea instructiunilor, ca si prin aranjarea judicioasa a elementelor de test in functie de dificultate, este de luat in consideratie orientarea personala in situatia de a raspunde. De exemplu, in cazul necunoas-terii raspunsului corect, unii subiecti vor prefera sa aleaga raspunsul "adevarat" in cazul unor itemi de tip alegere duala, pe cand altii vor tinde sa aleaga raspunsul "fals". Este, deci, de dorit sa se prevada un numar egal de variante corecte pentru fiecare din cele doua alternative de raspuns.
Factorii de grup
Proiectarea unui test si estimarea validitatii sale este in cea mai mare parte a cazurilor dependenta de caracteristicile unui grup de referinta avut in vedere la proiectare si utilizat la validare. Nu este obligatoriu ca, in cazul folosirii testului pentru grupuri cu caracteristici diferite, acesta sa isi mentina validitatea.
Fidelitatea
In timp ce validitatea este legata in special de directionarea masurarii (daca sunt efectiv abordate aspecte dorite), fidelitatea este, in primul rand, legata de calitatea acesteia.
Un instrument de masura a lungimii, construit dintr-un material cu un foarte mare coeficient de dilatare, ar fi de redusa utilitate, din moment ce va indica pentru acelasi obiect dimensiuni diferite de la o zi la alta, poate chiar de la o ora la alta.
Pentru un test de cunostinte sunt deosebit de importante doua calitati, ce definesc fidelitatea masurarii:
1. diferentele intre scorurile obtinute de subiecti sa fie in cea mai mare masura rezultatul diferentelor reale dintre acestia, din punctul de vedere al performantelor masurate de test;
2. repetarea aplicarii testului pe acelasi grup de subiecti sa evidentieze un inalt nivel de stabilitate a scorurilor individuale si, implicit, a ierarhizarii subiectilor.
Spre deosebire de validitate, la estimarea careia se utilizeaza frecvent judecata experta, estimarea fidelitatii se realizeaza mai ales prin calcule statistice.
Factori care influenteaza fidelitatea
Lungimea testului
Este usor de prevazut ca un test va fi cu atat mai fidel cu cat va fi mai lung, intrucat un test lung va putea satisface mai bine cerinta reprezentativitatii esantionului de itemi fata de continutul testat.
Imprastierea scorurilor
Fiecare aplicare a unui test produce o multime de scoruri indivi-duale, care pot fi ordonate intr-un sir limitat de scorul cel mai mic si de scorul cel mai mare.
Cu cat distanta intre aceste limite va fi mai mare, cu atat diferentele intre performantele individuale vor fi mai bine marcate, iar probabilitatea modificarii majore a ierarhizarii acestora la o noua aplicare a testului va fi redusa.
Dificultatea testului
In economia unui test au o valoare redusa itemii pe care fie toti subiectii ii rezolva corect, fie toti subiectii nu ii pot rezolva.
Un item de test are valoare de discriminare maxima daca din punctul de vedere al dificultatii se plaseaza in zona de "maxima incertitudine": 50 la suta din subiecti il pot rezolva, 50 la suta nu.
Pe cale de consecinta, un test ideal ar trebui sa aiba media scorurilor individuale plasata cat mai aproape de mijlocul intervalului dintre scorul maxim si scorul minim, iar imprastierea scorurilor sa acopere intreg acest interval.
Testele prea usoare, ca si cele prea dificile, vor fi caracterizate de o redusa imprastiere a scorurilor, acestea grupandu-se, in apropierea valorii maxime si, respectiv, in apropierea valorii minime, ceea ce conduce la o fidelitate redusa.
Obiectivitatea testului
Obiectivitatea este o caracteristica legata de diferentele ce pot aparea in cazul cotarii aceluiasi test de catre persoane diferite.
Testele proiectate pornindu-se de la itemi ce asigura o cotare obiectiva (alegere duala, alegere multipla, imperechere, raspuns scurt etc.) si care de obicei pot fi cotate de operatori cu pregatire medie, sau cu ajutorul tehnologiei informatice, limiteaza influentele negative asupra fidelitatii, rezultate din inconsistenta cotarii.
Aceasta nu inseamna ca testele vor trebui sa contina doar aceste tipuri de itemi, ci ca este necesar sa se incerce abordarea fiecarui tip de obiectiv printr-un item proiectat judicios, urmarindu-se imbunata-tirea obiectivitatii cotarii chiar pentru itemii de tip eseu, prin elabo-rarea unor liste de descriptori sau criterii utilizabile la cotare.
Eroarea standard a masurarii
Suntem deja familiarizati cu ideea ca aplicarea repetata a aceluiasi test nu va produce pentru un subiect o repetare a scorului obtinut la prima aplicare, ci, foarte probabil, se va concretiza intr-un grup de scoruri, in interiorul caruia se va afla scorul "adevarat".
Eroarea standard a masurarii este o valoare care ne indica, pentru o singura aplicare a testului, cunoscand scorul obtinut de un subiect, intervalul in care se va gasi cu cea mai mare probabilitate scorul "adevarat".
Fezabilitatea
Considerentele de ordin practic nu vor putea fi eludate in selectionarea sau proiectarea unui test de cunostinte, ca si in plani-ficarea testarii. Cel putin patru factori sunt de luat in consideratie:
Usurinta administrarii
Este recomandabil ca profesorul cu experienta inca limitata in testarea cunostintelor sa aleaga pentru utilizare teste de dimensiuni rezonabile, cu instructiuni simple si clare. In caz contrar, lipsa de experienta va putea conduce la aparitia unor erori in comunicarea sau utilizarea instructiunilor, la nerespectarea unor limite de timp, toate acestea cu efecte negative asupra validitatii si fidelitatii rezultatelor.
Pe de alta parte, in cazul utilizarii unor teste standardizate de catre evaluatori calificati, usurinta administrarii nu va mai constitui o restrictie importanta.
Timpul necesar pentru administrare
Tendinta de a selectiona sau proiecta un test scurt, administrabil intr-un interval de timp redus, va fi intotdeauna manifesta. De altfel, nici nu este rationa1 sa se utilizeze teste excesiv de lungi, daca variante mai scurte se dovedesc valide si fidele.
Se considera ca un test aplicat intr-un
interval de timp de
60 minute poate furniza scoruri totale
caracterizate de fidelitate, insa nu intotdeauna acelasi lucru se va
putea spune despre scorurile
partiale pe diferitele sale subteste.
Simplitatea cotarii
Un test a carui cotare va fi rapida si lipsita de ambiguitati va facilita sarcina profesorului si va favoriza testarea unui numar mai mare de subiecti sau unui volum sporit de continut in acelasi interval de timp.
Unele dintre tendintele recente in practica testarii cunostintelor actioneaza in acest sens:
1. Tendinta utilizarii unor teste standardizate compuse in mare parte din itemi cu cotare obiectiva.
2. Claritatea instructiunilor de cotare si simplificarea "cheilor" de cotare.
3. Utilizarea foilor de raspuns separate.
4. Cotarea cu ajutorul tehnologiei informatice.
Selectionarea pentru utilizare a unor teste ce reclama minimum de timp si pregatire specifica pentru cotare poate influenta favorabil si costul testarii. Spre exemplu, utilizarea foilor de raspuns separate permite reutilizarea brosurilor cuprinzand itemii testelor.
Simplitatea si claritatea interpretarii
In fond, valoarea oricarui sistem de testare este data de utilitatea rezultatelor pentru administratori, profesori, elevi si parinti, care vor putea lua decizii in cunostinta de cauza.
Informatii privind interpretarea si utilizarea rezultatelor pot fi, de regula, obtinute din manuale sau din alte documente descriptive ce insotesc testele. De o deosebita importanta sunt indicatiile privind transformarea scorurilor brute in scoruri derivate semnificative, claritatea cu care sunt prezentate normele de interpretare si sugestiile privind utilizarea rezultatelor in solutionarea problemelor de ordin educativ.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 2638
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved