Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
Statistica


Forme ale distributiei scorurilor

Statistica



+ Font mai mare | - Font mai mic



Forme ale distributiei scorurilor



Este foarte important de studiat forma distributiilor scorurilor pentru o variabila. Este bine ca o distributie sa fie simetrica si cu o forma normala (forma de clopot).

Distributia normala, a fost descrisa prima data de Ch. Fr. Gauss (1777-1855) si de aceea distributia normala se mai numeste si distributie gaussiana. Deoarece la demonstrarea acestui concept a participat si P.S. Laplace (1749-1827), in literatura de specialitate se va intalni si termenul de distributie Gauss-Laplace.

Pentru ca o distributie sa fie considerata normala, trebuiesc indeplinite simultan urmatoarele conditii:

Sa fie unimodala - adica sa existe un singur modul, o singura categorie cu frecventa maxima;

Sa fie simetrica fata de medie - adica sa nu fie deplasata spre stanga sau spre dreapta;

Sa fie normal boltita - adica sa nu fie nici ascutita si nici "turtita";

Toti acesti termeni se refera la acelasi lucru, distributia normala.

De asemenea, limitele din stanga si din dreapta ale unei distributii normale tind spre valoarea zero, pe care insa nu o intalnesc niciodata. O distributie perfect normala are aceeasi valoare pentru toti cei trei indicatori ai tendintei centrale (media, mediana si modulul), adica media = mediana = modulul. In practica, acest lucru se intalneste extrem de rar si, de aceea, ne punem problema intre ce limite putem considera o distributie ca fiind normala.

In exemplul urmator este elaborat un tabel de frecventa si o histograma cu scorurile obtinute la evaluarea coeficientului de inteligenta pentru 20 de juristi.

Introducerea datelor.

Pasul 1:

In "Variable View" din

"Data Editor" se denumeste

prima coloana "Atentie".

Se inlatura cele doua zecimale.

*Datele se salveaza ca fisier deoarece vor fi folosite si la capitolul 9.

Pasul 2:

In "Data View" din "Data Editor" se introduc scorurile obtinute la "Atentie" in prima coloana.

Pasul 3

Se selecteaza "Analyze", "Descriptives Statistics" si Frequencies."


Pasul 4:   

Se selecteaza "atentie" si apoi se apasa butonul ►pentru a

introduce in lista de variabile. Se apasa "OK".

. Interpretarea Output-ului

Prima coloana arata scorurile obtinute la testul de "atentie".   


A doua coloana arata frecventa acestor valori.

Exemplu: este 1 caz in care scorul obtinut are valoarea 55.

A treia coloana exprima aceste frecvente ca

un procent al numarului total A patra coloana A cincea coloana

incluzand si datele care exprima aceste frecvente cumuleaza aceste

lipsesc. ca un procent al numarului procentaje in josul

Exemplu: Din totalul cazurilor, total excluzand datele lipsa. tabelului.

5% au obtinut scorul 55.

. Histograme.

Histograma este un grafic, folosit in statistica descriptiva si arata o distributie de frecventa. Distributia de frecventa se refera la numarul de evenimente statistice pe clase (grupe) de evenimente. Pentru o serie de date statistice cu o distributie de frecventa dupa o variabila numerica continua (sau continua pe portiuni), reprezentarile grafice care ne permit sa vizualizam distributia de frecvente sunt histograma si poligonul frecventelor.

Pasul 1:

Se seleteaza:

"Graphs",

"Histogram"

Pasul 2:

Se selecteaza "Atentie"si apoi se apasa

butonul ►

pentru a o introduce in butonul ► butonul ► pentru a o introduce in caseta de

in caseta de variabile Se apasa "OK".

Variabile.

Se apasa "OK"

Interpretarea output-ului

Axa verticala arata frecventa cazurilor de la 0 la 14 din doi in doi.

Inaltimea barelor arata cat de frecvent apare fiecare scor la atentie.

Axa orizontala arata scorurile diferite ale "Atentiei".

*Media scorului la atentie este 62,2.

*Abaterea standard este 4,36.

*Numarul cazurilor este 20.

Modalitatea.

O distributie normala (figura 1) este o distributie unimodala, adica exista doar o singura categorie cu frecventa maxima. Prezenta a doua sau mai multe valori mod determina distributii bimodale, trimodale, in general polimodale, distributii ce nu pot fi considerate ca fiind distributii normale.

Figura nr. 1.

O distributie similara distributiei din figura 1, este o distributie bimodala (figura 2), deoarece observam existenta a doua categorii cu frecventa egala si maxima.

Figura nr. 2.

Normalitatea distributiei, sub aspectul modalitatii, se verifica prin calcularea valorii modul. Daca exista o singura valoare cu frecventa maxima, atunci distributia poate fi considerata normala sub acest aspect. In conditiile in care sunt doua sau mai multe valori cu frecventa maxima si, evident, egala, distributia este polimodala (multimodala) si nu poate fi considerata ca fiind normala.

6. Simetria.

O distributie este simetrica, daca valorile sunt egal (simetric) raspandite in jurul tendintei centrale. Atunci cand rezultatele tind catre valori mici, sunt aglomerate in partea stanga a distributiei, avem de a face cu o distributie asimetrica spre Figura nr. 3 dreapta (sau distributie skewness pozitiv).

Cand rezultatele tind catre valori mari, se aglomereaza in partea dreapta a distributiei, vorbim despre o distributie asimetrica la stanga (skewness negativ). Iata ca, asimetria este data de panta distributiei si nu de varful acesteia, asa cum trateaza si considera unii.

In figura nr. 3, distributia "B" este o distributie simetrica. Distributia "A" este o distributie asimetrica la dreapta (skewness pozitiv) unde predomina scorurile scazute (mici), in timp ce distributia "C" este o distributie asimetrica la stanga (skewness negativ) in care predomina scorurile mari.

Nu ne putem limita la o apreciere pur vizuala a simetriei; acest lucru necesita demonstrarea statistica a simetriei sau asimetriei distributiei. In acest scop, exista mai multi coeficienti care pot fi calculati.

Atunci cand discutam de asimetrie, trebuie sa precizam o serie de relatii care apar intre indicatorii tendintei centrale, media, mediana si modul.

Intr-o distributie simetrica, media, mediana si modul au exact aceleasi valori. Caracteristica acestei distributii o reprezinta coincidenta absoluta a celor trei indicatori ai tendintei centrale. Dupa cum puteti observa in figura de mai sus, atat media, cat si mediana si modulul, se afla in acelasi punct, la mijlocul distributiei. Grupa subiectilor cu scoruri     Figura nr. 4

mai mici decat media este perfect simetrica cu grupa subiectilor cu scoruri mai mari decat media. Acest aspect este mentionat din ratiuni teoretice. In practica nu vom intalni o distributie perfect normala, ci o distributie care poate fi acceptata ca fiind normala.

Intr-o distributie asimetrica la dreapta (distributie skewness pozitiv, vezi figura alaturata), predomina scorurile mici. In acest caz, modulul este valoarea situata cel mai la stanga in sirul de date, iar mediana este mai mica decat media. Evident, mediana fiind valoarea care imparte sirul     ordonat de date in doua Figura nr. 5

parti egale, iar daca in distributie predomina scorurile mici, atunci scorurile mari sunt considerate ca scoruri extreme. Stim de la analiza preciziei indicatorilor tendintei centrale, ca intr-o serie de date in care intalnim scoruri extreme mari, media tinde sa le puna in valoare. Iata ca acest fapt este ilustrat grafic in figura de mai sus.

Observati relatia existenta intr-o asemenea distributie: Mo<Me<m. Aceasta relatie este relatia caracteristica a unei distributii asimetrice pozit

Intr-o distributie asimetrica la stanga (distributie skewness negativ, vezi figura alaturata), predomina scorurile mari. In acest caz, modulul este valoarea situata cel mai la dreapta in sirul de date, iar mediana este mai mare decat media. Evident, mediana fiind valoarea care imparte sirul ordonat de date in doua parti egale, Figura nr. 6

iar daca in distributie predomina scorurile mari, atunci scorurile mici sunt considerate ca scoruri extreme. Stim, de la analiza preciziei indicatorilor tendintei centrale, ca intr-o serie de date in care intalnim scoruri extreme mici, media tinde sa le puna in valoare. Iata ca acest fapt este ilustrat grafic in figura de mai sus. Observati relatia existenta intr-o asemenea distributie: Mo>Me>m Aceasta relatie este relatia caracteristica a unei distributii asimetrice negat

7. Boltirea (excesul).

Asimetria pe orizontala, presupune, dupa cum am vazut, o deplasare a tendintei centrale spre stanga sau spre dreapta, catre scoruri mici sau catre scoruri mari. Dar, aceasta nu este singura asimetrie posibila. Exista si un fel de "asimetrie verticala" sau boltire. Termenul folosit generic pentru acest concept este termenul de kurtosis (din limba greaca, kurtos = "cocosat").

Practic, boltirea se refera la aspectul "cocoasei" distributiei rezultatelor. Cocoasa poate fi ascutita si atunci vorbim de o distributie ascutita sau leptocurtica, poate fi turtita, distributia turtita, plata sau platicurtica sau normala, distributie mezocurtica. O distributie normala este intotdeauna o distributie mezocurtica.

In figura alaturata, distributia "C" este o distributie leptocurtica, ascutita. Distributia "B" este o distributie platicurtica, turtita, iar distributia "A" este o distributie normala sub aspectul boltirii, sau mezocurtica.

Figura nr. 7

Se observa ca boltirea nu este altceva decat simetria pe axa verticala (OY), spre deosebire de simetria propriu zisa, deplasarea valorilor pe axa orizontala (OX). Daca la simetrie se vorbeste de frecvente (care sunt cele mai frecvente scoruri obtinute, unde se concentreaza acestea? In esantionul sunt mai degraba subiecti scunzi sau subiecti inalti? Ori poate exista un echilibru intre subiectii scunzi si cei inalti), la boltire se discuta de valori, de modul in care aceste valori se grupeaza in jurul tendintei centrale (sunt mai grupate valorile in jurul mediei sau, din contra, foarte imprastiate.)

La fel ca si simetria, boltirea nu poate fi apreciata pur "ochiometric" ci avem nevoie si aici de anumiti coeficienti de boltire. Pearson a discutat despre boltire in termeni de momente, la fel ca si simetria, rezultand astfel coeficientul de boltire sau coeficientul kurtosis.

O distributie leptocurtica, ascutita, arata ca datele sunt foarte grupate si apropiate de medie, lotul de subiecti avand un mare grad de omogenitate a scorurilor. Aceasta distributie nu ridica nici un fel de probleme atunci cand trebuie sa diferentiem subiectii care obtin scoruri mici sau mari. Avem insa dificultati atunci cand trebuie sa diferentiem subiectii din zona medie a distributiei.

De exemplu, daca intr-o clasa de 30 de elevi, 27 obtin medii anuale intre 7,9 si 8,1. Iata ca, doar doua zecimi diferentiaza intre aproape intreg efectivul de elevi. Nu avem nici o problema cu repartizarea celorlalti trei elevi. Pe aceia ii vom considera ori foarte buni, ori foarte slabi, in functie de media obtinuta - sub 7,9 sau peste 8,1. Ce ne facem insa cu cei 27 de subiecti? Suntem, iata, in imposibilitatea de ai-i ierarhiza in vreun fel. Daca presupunem ca cei trei subiecti au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi, premiul I, cine va lua premiul II si cine va lua premiul III. Decizia ar fi, dupa cum se poate vedea, extrem de dificila, daca nu chiar imposibila. Singura varianta in acest caz, ar putea fi cresterea preciziei. Nu calculam media cu o singura zecimala, ci cu 2, 3 sau 4 zecimale. Totusi, sunt situatii in care un asemenea nivel de precizie este ridicol. O evaluare in care distributia rezultatelor este leptocurtica, este o evaluare ce nu poate diferentia intre subiectii de nivel mediu, iar o curba leptokurtica nu este o distributie normala;

O distributie platicurtica, plata, este o distributie in care rezultatele sunt foarte imprastiate fata de medie si indica un grad ridicat de eterogenitate a scorurilor. Problema generala a acestei distributii, in opozitie cu distributia leptokurtica, este aceea ca diferentiaza greu la extreme si destul de bine in zona mediei. Va fi greu, utilizand o asemenea distributie, sa facem diferentieri intre elevii slabi si intre elevii buni, desi putem diferentia relativ usor elevii medii. Datorita acestui fapt, o distributie platicurtica nu este nici ea o distributie normala.

O distributie normala este o distributie mezocurtica.

Analiza unei distributii sub aspectul normalitatii este primul pas pe care il facem in orice prelucrare de date. Deoarece, in functie de rezultatul acestei analize, vom putea alege tehnicile si procedeele statistice pe care le putem folosi, aceasta etapa o intalnim, de obicei, la inceputul oricarui raport de cercetare, imediat dupa descrierea esantionului.

    8. Alegeti raspunsul corect

 


Histograma:

a.       este un grafic folosit in statistica descriptiva;

b.      arata o distributie de frecventa;

c.       se foloseste pentru date calitative.

Valid procent:

a. exprima aceste frecvente ca un procent al numarului total excluzand datele lipsa.

b. frecvente ca un procent al numarului total lipsesc incluzand si datele care

lipsesc.   

c. frecventa valorilor.

Pentru a obtine un tabel de frecvente accesam:

a.       analyze/ descriptive statistics/frequences;

b.      analyze/ descriptive statistics/descriptives;

c.       analyze/ descriptive statistics/frequences/descriptives.

Pentru a crea o histograma accesam:

a.       graphs/histogram;

b.      graphs/interactve;

c.       graphs/control.

O distributie poate fi:

a.       unimodala;

b.      bimodala;

c.       trimodala.

Intr-o distributie simetica:

a.       media < mdiana< modul;

b.      media = mediana = modul;

c.       media >mediana>modul.

Intr-o distributie asimetrica la dreapta:

a.       modul <mediana<media;

b.      modul>mediana>modul;

c.       modul=mediana=modul.

8. Intr-o distributie asimetrica la dreapta:

a. modul=mediana=media;

b. modul <mediana>modul;

c. modul>mediana>modul.

9. O distributie poate fi:

a.       leptocurtica;

b.      platicurtica;

c.       asimetrica pozitiv;

d.      asimetrica negativ;

e.       mezocurtica.

f.        toate variantele de mai sus.

10. O distributie leptocurtica arata ca:

  1. datele sunt foarte grupate si apropiate de mediana iar lotul de subiecti are un grad mare de omogenitate;
  2. datele sunt foarte imprastiate de mediana iar lotul de subiecti are un grad mare de eterogenitate;
  3. distributia este normala.
  1. O distributie platicurtica arata ca:
  1. datele sunt foarte grupate si apropiate de mediana iar lotul de subiecti are un grad mare de omogenitate;
  2. datele sunt foarte imprastiate de mediana iar lotul de subiecti are un grad mare de eterogenitate;
  3. distributia este normala.

    9. Raspunsuri corecte

 


1. a. este un grafic folosit in statistica descriptiva;

b. arata o distributie de frecventa;

2. a. analyze/ descriptive statistics/frequences;

3. a. analyze/ descriptive statistics/frequences;

4. a. graphs/histogram;

5. a. unimodala;

b. bimodala;

c. trimodala.

6. b. media = mediana = modul;

7. b. modul <mediana<media;

8. c. modul>mediana>modul.

9. f. toate variantele de mai sus.

10. a. datele sunt foarte grupate si apropiate de mediana iar lotul de subiecti are un grad mare de omogenitate;

11. b. datele sunt foarte imprastiate de mediana iar lotul de subiecti are un grad mare de eterogenitate;



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 10711
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved