CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
DISPERSIE SI ASIMETRIE
Notiunea de dispersie
Indicatorii simpli si sintetici ai dispersiei
Proprietati si calculul simplificat al dispersiei
Indicatori de asimetrie si ai excesului
Notiunea de dispersie
Dupa definirea mediei ca marime care reprezinta in mod sintetic ansamblul nivelurilor individuale ale unei caracteristici pentru o colectivitate, statistica studiaza imprastierea acestor niveluri de la medie.
Fenomenul de imprastiere, de abatere a valorilor individuale ale unei caracteristici de la medie, in cadrul unei colectivitati statistice, se numeste dispersie.
Cercetarea dispersiei reprezinta o modalitate care completeaza posibilitatea determinarii caracterului reprezentativ al unei medii si forma sa de distributie.
Pentru a verifica gradul de omogenitate al caracteristicilor pentru care se determina media, se calculeaza indicatorii de variatie, de asimetrie si de exces. Acesti indicatori separa actiunea factorilor esentiali de actiunea factorilor intamplatori. Aceasta functie de cunoastere este folosita in special pentru acele fenomene la care, pe langa actiunea separata a factorilor, se mai adauga si interactiunea dintre factori.
Dispersia, adica studierea variatiei unei caracteristici, permite urmatoarele constatari:
-daca colectivitatea statistica este sau nu omogena;
-care este structura colectivitatii pentru care s-a calculat media;
-daca media caracterizeaza sau nu just colectivitatea;
-cat de mare este variatia caracteristicii;
-care este abaterea medie a valorilor individuale fata de media lor.
In statistica se utilizeaza doua categorii principale de masuratori si indicatori medii ai dispersiei, unii facand parte din sistemul mediei aritmetice, iar altii din sistemul medianei.
Indicatorii simpli si sintetici ai dispersiei
Gradul de variatie a valorilor individuale in jurul mediei se masoara cu ajutorul unui sistem de indicatori simpli si sintetici ai dispersiei, in cazul seriilor unidimensionale, respectiv, al unui sistem de indicatori factoriali ai dispersiei in cazul seriilor bi- si multidimensionale[1].
Indicatorii simpli ai dispersiei
Indicatorii simpli ai dispersiei masoara campul de imprastiere al caracteristicii, precum si imprastierea fiecarui nivel individual al caracteristicii fata de nivelul lor mediu. Indicatorii simpli ai dispersiei sunt: amplitudinea variatiei si abaterea individuala. Acesti indicatori se pot calcula atat in marimi absolute, cat si in marimi relative.
Amplitudinea variatiei - este un indicator ce caracterizeaza marimea intervalului de valori ale caracteristicii.
In marime absoluta, amplitudinea se calculeaza prin diferenta dintre valorile extreme ale seriei de distributiei, astfel:
Acest indicator nu tine seama de toate valorile observate, ci doar de cele extreme care, in cazul cand sunt aberante, denatureaza imaginea fenomenului de dispersie.
In marime relativa, amplitudinea variatiei se determina ca raport intre amplitudinea absoluta si nivelul mediu al caracteristicii:
, unde:
= nivelul maxim, respectiv minim al variabilei X;
= nivelul mediu al variabilei X.
2. Abaterea individuala - ofera informatii doar la nivelul fiecarei variante , pierzand imaginea dispersiei pe ansamblul distributiei.
In marime absoluta, abaterea individuala se calculeaza conform relatiei urmatoare:
In marime relativa, abaterea individuala se determina ca raport intre abaterea absoluta si nivelul mediu al caracteristicii:
Indicatorii sintetici ai dispersiei
Indicatorii sintetici ai dispersiei exprima imprastierea tuturor nivelurilor individuale ale unei caracteristici fata de nivelul lor mediu. Pentru a caracteriza pe ansamblu o serie de date, se utilizeaza urmatorii indicatori sintetici ai dispersiei: abaterea medie liniara, varianta (dispersia), abaterea medie patratica (deviatia standard) si coeficientul de variatie[2].
1. Abaterea medie liniara - se determina ca medie aritmetica a valorilor absolute ale abaterilor individuale. Abaterea medie liniara arata variatia medie, in plus si in minus, de la valoarea medie a distributiei si este cu atat mai mica cu cat valorile sunt mai grupate in jurul mediei.
-pentru serii simple: , cand ,
-pentru serii cu frecvente: , cand
2. Varianta (dispersia) - se calculeaza ca medie aritmetica a patratelor valorilor abaterilor individuale fata de media lor, conform relatiilor:
-pentru serii simple: ,
-pentru serii cu frecvente: .
3. Abaterea medie patratica (deviatia standard) - se calculeaza ca o medie a abaterilor individuale, dupa relatia:
-pentru serii simple:
-pentru serii cu frecvente:
Abaterea medie patratica, fiind calculata ca o medie patratica, reflecta intr-o masura mai mare influenta factorilor aleatori comparativ cu abaterea medie liniara. Acest indicator se utilizeaza, de regula, pentru caracterizarea seriilor teoretice si se exprima in unitatea de masura a mediei seriei de date.
4. Intervalul mediu de variatie - se poate calcula pe baza indicatorilor sintetici ai dispersiei. Acesta este definit de urmatoarele limite:
, respectiv
Intr-o distributie normala standard, in intervalul mediu apar 68,27% din cazuri; 95,45% pentru , respectiv 99,97% din cazuri pentru .
5. Coeficientul mediu de variatie - se utilizeaza atunci cand unitatile de masura folosite pentru exprimarea indicatorilor sintetici trebuie aduse la aceeasi baza de semnificatie. Se calculeaza ca raport procentual intre abaterea medie liniara sau abaterea medie patratica si media aritmetica astfel:
, respectiv .
Coeficientul de variatie poate lua valori cuprinse in intervalul (0;100%). Cand tinde spre zero, se considera o variatie slaba si deci o colectivitate omogena, iar media are un grad de reprezentativitate ridicat. Cu cat nivelul coeficientului de variatie tinde spre 100%, cu atat variatia este mai intensa, colectivitatea mai eterogena, iar media are un nivel de reprezentativitate mai scazut. Prin urmare, coeficientul de variatie poate fi folosit si ca test de semnificatie a reprezentativitatii mediei, considerandu-se urmatoarele praguri de semnificatie:
Ex. Firma SC. Seromgal S.A. a vandut in anul 2004 produsul agroalimentar "tomate" prin cele cinci ferme la preturi diferite. Utilizand indicatorii simpli si sintetici ai dispersiei, vom determina pretul mediu de vanzare al produsului si varianta acestuia.
|
|
|
|
|
Media aritmetica
mii lei.
Indicatorii simpli ai dispersiei
Amplitudinea variatiei
- in marimi absolute:
mii lei
- in marimi relative:
Rezultatele obtinute ne arata ca, campul de variatie al pretului de vanzare al tomatelor prin cele cinci ferme este de 421 mii lei, ceea ce reprezinta 6,34% din pretul de vanzare al produsului.
Abaterea individuala
- in marimi absolute:
- in marimi relative:
Indicatorii sintetici ai dispersiei
Abaterea medie liniara
mii lei
Pretul de vanzare prin cele cinci ferme se abate in medie cu 141,6 mii lei fata de pretul mediu, in ambele sensuri, intervalul mediu de variatie stabilit cu ajutorul acestui indicator avand urmatoarele limite:
Varianta:
Abaterea medie patratica
mii lei
Intervalul mediu de variatie
Aceasta inseamna ca 68% din unitatile colectivitatii practica un pret cuprins intre 6486,28 mii lei si 6799,72 mii lei.
Comparand rezultatele, se observa ca , fapt explicat prin aceea ca , fiind calculata ca o medie patratica, reflecta intr-o masura mai mare influenta factorilor intamplatori, adica abaterile mai mari fata de medie, comparativ cu . Abaterile extreme, prin ridicarea la patrat, au o influenta mai mare decat abaterile intermediare mai apropiate de medie. Deci, abaterea medie patratica caracterizeaza mai bine variatia fenomenelor.
Coeficientul de variatie
, releva o colectivitate omogena, ceea ce inseamna ca media este semnificativa pentru distributie.
Proprietati si calculul simplificat al dispersiei
Proprietatile dispersiei sunt:
Dispersia unei distributii este egala cu diferenta dintre media patratelor tuturor variantelor caracteristicii si patratul mediei
Dispersia unui sir de valori constante este egala cu zero, intrucat toate variantele caracteristicii sunt egale intre ele si egale cu media lor aritmetica.
Dispersia calculata din abaterile variantelor caracteristicii fata de constanta "a" este mai mare decat dispersia calculata din aceleasi variante fata de media lor cu patratul diferentei dintre medie si constanta "a".
-pentru serii simple: ,
-pentru serii cu frecvente: .
Daca fiecare nivel al caracteristicii se micsoreaza de "k" ori, atunci dispersia se micsoreaza de "k2" ori.
-pentru serii simple: ,
-pentru serii cu frecvente: .
Daca se imparte fiecare nivel al frecventelor printr-o constanta "c", atunci dispersia ramane neschimbata.
Aceste proprietati sunt folosite pentru calculul simplificat al dispersiei. Din combinarea lor se ajunge la formulele care conduc la cea mai mare simplificare a calculelor.
-pentru serii simple: ,
-pentru serii cu frecvente: .
Ex. Gruparea salariatilor unei unitati comerciale dupa volumul vanzarilor zilnice (mii lei):
Grupe sal. dupa vanz |
Nr. sal. ni |
xi |
|
|
|
|
|
|
Total |
|
Sa se determine numarul mediu al salariatilor utilizand dispersia prin calcul simplificat.
-dispersia prin calcul simplificat:
mii lei
a = 1500; k = 100; c = 5.
-abaterea medie patratica:
-intervalul mediu de variatie are urmatoarele limite:
Indicatori de asimetrie si ai excesului
In analiza seriilor de distributie unidimensionale si unimodale, un interes deosebit prezinta cunoasterea formei distributiei.
Forma unei distributii statistice poate fi apreciata cu ajutorul a doua categorii de valori tipice:
Indicatorii de asimetrie
Indicatorii de boltire sau ai excesului
Indicatorii de asimetrie dau informatii asupra modului de repartizare a frecventelor de o parte sau alta a valorii centrale a unei serii.
Asimetria reprezinta o deviatie de la forma simetrica de distributie.
In literatura de specialitate s-au propus mai multi indicatori pentru masurarea gradului de asimetrie al distributiilor.
O prima imagine asupra gradului de asimetrie (As) al unei distributii o putem face comparand media ei asimetrica cu modul.
, asimetrie negativa, cu extinderea frecventelor spre stanga.
, asimetrie pozitiva, cu extinderea frecventelor spre dreapta.
In marimi relative se utilizeaza coeficientul de asimetrie a lui Pearson (kas).
Daca kas =0, , distributie simetrica
Daca kas >0, , distributie asimetrica spre dreapta
Daca kas <0, , distributie asimetrica spre stanga.
Pentru seriile moderat asimetrice, coef. de asimetrie trebuie sa ia valori cuprinse in intervalul (-0,3 ; 0,3). Pentru valori in afara acestui interval se considera ca distributiile respective sunt puternic asimetrice.
Informatiile pe care le ofera coef. de asimetrie sunt foarte utile atat pentru aprecierea tipului distributiilor, cat si pentru aprecierea semnificatiei indicatorilor tendintei centrale, mai ales pentru .
Asupra asimetriei influenteaza si celelalte marimi medii de pozitie. Pentru a tine seama si de influenta quartilelor, se foloseste coeficientul de asimetrie Yule (Cay).
, unde: q2 = Q3 - Me
q1 = Me - Q1.
In cazul coef. Yule, se raporteaza diferenta dintre abaterile celor doua quartile extreme de la mediana, la suma acestora.
Daca valorile Cay se apropie de , atunci distributia este moderat asimetrica, iar dcaa depasesc , atunci distributia este pronuntat asimetrica.
Ex. Gruparea muncitorilor dupa productia saptamanala (m):
Grupe muncit. dupa prod. |
Nr. muncit. ni |
|
xini |
|
|
|
Ni |
Total |
Sa se studieze gradul de asimetrie al distributiei.
Coef. de asimetrie Pearson
, asimetrie moderata spre stanga.
Coef. de asimetrie Yule q2 = Q3 - Me
q1 = Me - Q1.
m
m
m
q2 = Q3 - Me = 18,33-16=2,33
q1 = Me - Q1 = 16-12,5=3,5
asimetrie spre stanga.
2) Indicatorii de boltire.
In caracterizarea distributiilor intereseaza si determinarea gradului de concentrare, de aglomerare a frecventelor in zona centrala a distributiei. Aceasta insusire este cunoscuta sub denumirea de exces, curtozis sau boltire.
Indicatorii boltirii arata daca o distributie este mai boltita decat distributia normala, perfect simetrica sau mai putin boltita decat aceasta.
Daca intr-o distributie variantele unei variabile sunt concentrate in jurul nivelului ei mediu mai mult decat in cazul unei distributii normale, atunci distributia considerata va fi mai boltita decat distributia normala, iar graficul ei poarta denumirea de curba leptokurtica (leptos = subtire). Daca curba este mai putin boltita decat cea normala, ea poarta denumirea de curba platikurtica (platus = lat in greaca, iar curtosis = cocoasa). Curba normala este numita si curba mesokurtica.
In determinarea excesului se utilizeaza coef. de boltire Pearson () si coef. de boltire Fisher ().
Coef. Pearson este raportul dintre momentul centrat de ordin 4 si patratul momentului centrat de ordinul 2.
, unde: este dispersia.
, iar se determina dupa relatia:
Pentru o distributie normala (curba Gauss-Laplace), coeficientul de boltire ia valoarea 3. Daca , atunci distributia este leptocurtica, iar daca , atunci distributia este platicurtica.
Coef. de boltire Fisher () masoara excesul fata de boltirea unei distributii normale Gauss-Laplace. Stiind ca pentru o distributie normala , gradul de exces se calculeaza dupa relatia:
, cu interpretarea:
daca , , distributie normala;
, , distributie leptocurtica;
, , distributie platicurtica.
Ex. Gruparea salariatilor dupa volumul vanzarilor (mil lei):
Grupe sal. dupa vanzari |
Nr. sal. ni |
|
xini |
|
|
|
|
|
Total |
Sa se studieze forma distributiei cu ajutorul coeficientilor boltirii Fisher.
mil lei
distributie leptocurtica.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 5820
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved