Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
Alimentatie nutritieAsistenta socialaCosmetica frumuseteLogopedieRetete culinareSport


Indicatorii imprastierii si indicatorii formei distributiei

Asistenta sociala



+ Font mai mare | - Font mai mic



Indicatorii imprastierii si indicatorii formei distributiei

Aceeasi medie poate fi obtinuta din valori cu un camp de variatie diferit; cu cat acest camp de variatie este mai mic (datele sunt mai apropiate, mai "omogene"), cu atat media este mai reprezentativa.



Inainte de a folosi o medie in analiza/ fundamentarea deciziilor, trebuie sa verificam omogenitatea datelor. In acest scop, folosim indicatorii imprastierii sau ai variabilitatii, care arata masura in care valorile unei serii difera de medie.

Indicatorii variabilitatii se impart in doua categorii: indicatori elementari si indicatori sintetici.

1. Indicatorii elementari ai variabilitatii sunt calculati folosind doar doua valori ale distributiei. Usor de calculat, prezinta insa dezavantajul de a fi nesiguri si de a nu putea fi folositi in statisticile avansate. Printre acesti indicatori elementari se numara: amplitudinea si abaterea interquatila.

Amplitudinea (engl. Range, R)

marimea intervalului in care sunt cuprinse valorile (plaja valorilor)

formula de calcul: R = xmax - xmin

- cu cat este mai mare: datele tind sa fie mai eterogene

- dezavantaj: poate fi influentata de o singura valoare extrema

Abaterea interquartila

- se calculeaza ca diferenta dintre quartila 3 si quartila 1 (este egala cu inaltimea casetei Boxplotului)

RQ Q3 - Q1

- reprezinta un indicator mai robust al imprastierii, nefiind afectata de valorile extreme

2. Indicatorii sintetici ai variabilitatii sunt calculati luand in calcul abaterea fiecarei valori de la medie. In aceasta categorie se includ: abaterea medie; dispersia; abaterea standard si coeficientul de variatie.

Abaterea individuala a valorii este egala cu distanta dintre o valoare si media distributiei (xi - ). Pe o distributie, suma acestor abateri individuale este egala cu zero, de aceea acest indicator nu poate fi folosit in statistici avansate.

O solutie ar fi considerarea acestor abateri individuale in valoare absoluta (fara semn), caz in care, realizand media lor, am obtine abaterea medie (= media distantelor dintre fiecare scor si media distributiei). Dar nici acest indicator nu este potrivit cu statisticile avansate.

Cea mai potrivita solutie o reprezinta ridicarea la patrat a abaterilor individuale si calcularea mediei acestor abateri ridicate la patrat; se obtine astfel dispersia.

Dispersia (varianta, abaterea medie patratica)

se noteaza cu "s " pentru esantion si " pentru populatie

cu cat este mai mare: gradul de imprastiere este mai mare

formula de calcul:

pentru serii simple:

(xi -

ni

pentru serii de frecventa - formula ponderata:

(xi - ni

Σ ni

OBS. dispersia calculata la nivel de esantion (s ) contine o imprecizie (bias); de aceea, pentru esantion, formulele suporta la numitor o corectie, in sensul ca in loc de ni vom avea (ni - 1) iar in loc de ni vom avea ( ni - 1)[1].

Principalul inconvenient al dispersiei in reprezinta faptul ca nu are propriu-zis o unitate de masura (unitatea de masura apare la patrat). In plus, poate avea valori foarte mari. De aceea se recurge la extragerea radicalului din dispersie, obtinandu-se un alt indicator, abaterea standard.

Abaterea standard

arata: cu cat se abat in medie valorile individuale de la media lor

se calculeaza prin extragerea radicalului din expresia dispersiei

se noteaza cu "s" pentru esantion si " " (sigma) pentru populatie

este indicatorul principal al imprastierii, folosit in diverse statistici avansate

cu cat este mai mare: valorile sunt mai putin omogene si media este mai putin reprezentativa

se exprima in unitatile de masura ale variabilei; dar: nu poate fi folosita in comparatii cand avem variabile cu unitati de masura diferite; in acest caz, folosim coeficientul de variatie

Coeficientul de variatie

- este indicatorul care se calculeaza atunci cand se cere sa se verifice daca media este reprezentativa (daca seria este omogena d.p.d.v. al caracteristicii studiate)

- formula de calcul:

s

Cv =

interpretare Cv:

< 15%: media este reprezentativa (imprastiere mica)

15-30%: media este suficient de reprezentativa (imprastiere mijlocie)

> 30%[2]: media nu este reprezentativa (imprastiere mare)

Cv nu are unitate de masura; de aceea, il putem folosi pentru a compara omogenitatea a doua serii de valori (seria cu un Cv mai mic este mai omogena)

Exemplu - indicatorii variabilitatii

serie simpla

ex. golurile marcate de un fotbalist in ultimul sezon: 1,0,3,2,9 (valorile individuale)

= 3

R = 9-0 = 9 (valoarea 9 fiind valoare extrema, amplitudinea supraestimeaza imprastierea valorilor)

Abaterile individuale ale valorilor seriei (xi      - ): -2, -3, 0, -1, 6 (suma lor este zero)

Dispersia:

= 10

5

Abaterea standard: 3,165

Coeficientul de variatie: 3,165

Cv =

Concluzie: seria este neomogena (existand o valoare extrema mare - 9). Media nu este reprezentativa; solutia o constituie in acest caz calculul medianei (Me = 2).

2. serie de frecventa

Nr.prez.

Nr. studenti (ni)

xi -

(xi - )

(xi - ) ni

Total

ni = 30

(xi      - ni = 31,5

= 2,5

σ

σ

Cv = (1,02 / 2,5 ) * 100 = 40,8% : seria nu este omogena

Indicatori ai formei distributiei

dau informatii privitoare la forma curbei de reprezentare grafica a distributiei, prin comparatie cu o curba normala

sunt doi astfel de indicatori: asimetria si boltirea

Asimetria distributiei

arata: distributia valorilor in raport cu indicatorii tendintei centrale

nivelul (a)simetriei se poate dimensiona, folosind coeficientul de asimetrie (engl. skewness); din perspectiva asimetriei, distributiile se clasifica in:

distributii simetrice: valorile se impart in mod egal de o parte si de alta a valorilor tendintei centrale (pentru o distributie perfect simetrica, Cas =0; in practica, se accepta ca o distributie este simetrica daca -0,1 < Cas < 0,1)

distributii asimetrice: valorile se concentreaza fie in zona valorilor mici, fie in zona valorilor mari; avem doua tipuri de asimetrie:

asimetrie pozitiva: majoritatea valorilor sunt concentrate in zona valorilor mici (spre stanga); majoritatea membrilor unei populatii inregistreaza un nivel scazut al caracteristicii respective, ex. distributia persoanelor dupa venit

asimetrie negativa: majoritatea valorilor sunt concentrate in zona valorilor mari (spre dreapta); majoritatea membrilor unei populatii inregistreaza un nivel ridicat al caracteristicii respective, ex. distributia populatiei dupa varsta la deces

Boltirea distributiei

arata: gradul de extindere pe verticala a curbelor de distributie

nivelul boltirii se poate dimensiona, folosind coeficientul de boltire (engl. kurtosis)

din perspectiva boltirii, distributiile se clasifica in:

distributii cu boltire normala (mezocurtice)

distributii leptocurtice (ascutite)

distributii platicurtice (aplatizate)

OBS: Informatii privind forma distributiei se obtin atat calculand indicatorii formei distributiei, cat si apeland la tehnicile grafice (Boxplot, Histograma



se spune ca "pierdem un grad de libertate"

Soft-urile statistice calculeaza folosind numai formule corectate.

Obs.: in practica, pe serii cu imprastiere f. mare, se pot obtine pentru Cv si valori > 100%



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 4084
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved