CATEGORII DOCUMENTE |
Alimentatie nutritie | Asistenta sociala | Cosmetica frumusete | Logopedie | Retete culinare | Sport |
Indicatorii imprastierii si indicatorii formei distributiei
Aceeasi medie poate fi obtinuta din valori cu un camp de variatie diferit; cu cat acest camp de variatie este mai mic (datele sunt mai apropiate, mai "omogene"), cu atat media este mai reprezentativa.
Inainte de a folosi o medie in analiza/ fundamentarea deciziilor, trebuie sa verificam omogenitatea datelor. In acest scop, folosim indicatorii imprastierii sau ai variabilitatii, care arata masura in care valorile unei serii difera de medie.
Indicatorii variabilitatii se impart in doua categorii: indicatori elementari si indicatori sintetici.
1. Indicatorii elementari ai variabilitatii sunt calculati folosind doar doua valori ale distributiei. Usor de calculat, prezinta insa dezavantajul de a fi nesiguri si de a nu putea fi folositi in statisticile avansate. Printre acesti indicatori elementari se numara: amplitudinea si abaterea interquatila.
Amplitudinea (engl. Range, R)
marimea intervalului in care sunt cuprinse valorile (plaja valorilor)
formula de calcul: R = xmax - xmin
- cu cat este mai mare: datele tind sa fie mai eterogene
- dezavantaj: poate fi influentata de o singura valoare extrema
Abaterea interquartila
- se calculeaza ca diferenta dintre quartila 3 si quartila 1 (este egala cu inaltimea casetei Boxplotului)
RQ Q3 - Q1
- reprezinta un indicator mai robust al imprastierii, nefiind afectata de valorile extreme
2. Indicatorii sintetici ai variabilitatii sunt calculati luand in calcul abaterea fiecarei valori de la medie. In aceasta categorie se includ: abaterea medie; dispersia; abaterea standard si coeficientul de variatie.
Abaterea individuala a valorii este egala cu distanta dintre o valoare si media distributiei (xi - ). Pe o distributie, suma acestor abateri individuale este egala cu zero, de aceea acest indicator nu poate fi folosit in statistici avansate.
O solutie ar fi considerarea acestor abateri individuale in valoare absoluta (fara semn), caz in care, realizand media lor, am obtine abaterea medie (= media distantelor dintre fiecare scor si media distributiei). Dar nici acest indicator nu este potrivit cu statisticile avansate.
Cea mai potrivita solutie o reprezinta ridicarea la patrat a abaterilor individuale si calcularea mediei acestor abateri ridicate la patrat; se obtine astfel dispersia.
Dispersia (varianta, abaterea medie patratica)
se noteaza cu "s " pentru esantion si " pentru populatie
cu cat este mai mare: gradul de imprastiere este mai mare
formula de calcul:
pentru serii simple:
(xi -
ni
pentru serii de frecventa - formula ponderata:
(xi - ni
Σ ni
OBS. dispersia calculata la nivel de esantion (s ) contine o imprecizie (bias); de aceea, pentru esantion, formulele suporta la numitor o corectie, in sensul ca in loc de ni vom avea (ni - 1) iar in loc de ni vom avea ( ni - 1)[1].
Principalul inconvenient al dispersiei in reprezinta faptul ca nu are propriu-zis o unitate de masura (unitatea de masura apare la patrat). In plus, poate avea valori foarte mari. De aceea se recurge la extragerea radicalului din dispersie, obtinandu-se un alt indicator, abaterea standard.
Abaterea standard
arata: cu cat se abat in medie valorile individuale de la media lor
se calculeaza prin extragerea radicalului din expresia dispersiei
se noteaza cu "s" pentru esantion si " " (sigma) pentru populatie
este indicatorul principal al imprastierii, folosit in diverse statistici avansate
cu cat este mai mare: valorile sunt mai putin omogene si media este mai putin reprezentativa
se exprima in unitatile de masura ale variabilei; dar: nu poate fi folosita in comparatii cand avem variabile cu unitati de masura diferite; in acest caz, folosim coeficientul de variatie
Coeficientul de variatie
- este indicatorul care se calculeaza atunci cand se cere sa se verifice daca media este reprezentativa (daca seria este omogena d.p.d.v. al caracteristicii studiate)
- formula de calcul:
s
Cv =
interpretare Cv:
< 15%: media este reprezentativa (imprastiere mica)
15-30%: media este suficient de reprezentativa (imprastiere mijlocie)
> 30%[2]: media nu este reprezentativa (imprastiere mare)
Cv nu are unitate de masura; de aceea, il putem folosi pentru a compara omogenitatea a doua serii de valori (seria cu un Cv mai mic este mai omogena)
Exemplu - indicatorii variabilitatii
serie simpla
ex. golurile marcate de un fotbalist in ultimul sezon: 1,0,3,2,9 (valorile individuale)
= 3
R = 9-0 = 9 (valoarea 9 fiind valoare extrema, amplitudinea supraestimeaza imprastierea valorilor)
Abaterile individuale ale valorilor seriei (xi - ): -2, -3, 0, -1, 6 (suma lor este zero)
Dispersia:
= 10
5
Abaterea standard: 3,165
Coeficientul de variatie: 3,165
Cv =
Concluzie: seria este neomogena (existand o valoare extrema mare - 9). Media nu este reprezentativa; solutia o constituie in acest caz calculul medianei (Me = 2).
2. serie de frecventa
Nr.prez. |
Nr. studenti (ni) |
xi - |
(xi - ) |
(xi - ) ni |
| ||||
Total |
ni = 30 |
(xi - ni = 31,5 |
= 2,5
σ
σ
Cv = (1,02 / 2,5 ) * 100 = 40,8% : seria nu este omogena
Indicatori ai formei distributiei
dau informatii privitoare la forma curbei de reprezentare grafica a distributiei, prin comparatie cu o curba normala
sunt doi astfel de indicatori: asimetria si boltirea
Asimetria distributiei
arata: distributia valorilor in raport cu indicatorii tendintei centrale
nivelul (a)simetriei se poate dimensiona, folosind coeficientul de asimetrie (engl. skewness); din perspectiva asimetriei, distributiile se clasifica in:
distributii simetrice: valorile se impart in mod egal de o parte si de alta a valorilor tendintei centrale (pentru o distributie perfect simetrica, Cas =0; in practica, se accepta ca o distributie este simetrica daca -0,1 < Cas < 0,1)
distributii asimetrice: valorile se concentreaza fie in zona valorilor mici, fie in zona valorilor mari; avem doua tipuri de asimetrie:
asimetrie pozitiva: majoritatea valorilor sunt concentrate in zona valorilor mici (spre stanga); majoritatea membrilor unei populatii inregistreaza un nivel scazut al caracteristicii respective, ex. distributia persoanelor dupa venit
asimetrie negativa: majoritatea valorilor sunt concentrate in zona valorilor mari (spre dreapta); majoritatea membrilor unei populatii inregistreaza un nivel ridicat al caracteristicii respective, ex. distributia populatiei dupa varsta la deces
Boltirea distributiei
arata: gradul de extindere pe verticala a curbelor de distributie
nivelul boltirii se poate dimensiona, folosind coeficientul de boltire (engl. kurtosis)
din perspectiva boltirii, distributiile se clasifica in:
distributii cu boltire normala (mezocurtice)
distributii leptocurtice (ascutite)
distributii platicurtice (aplatizate)
OBS: Informatii privind forma distributiei se obtin atat calculand indicatorii formei distributiei, cat si apeland la tehnicile grafice (Boxplot, Histograma
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 4084
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved