Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
Statistica


Indicatori statistici - indicatori ai tendintei centrale, quartilele, indicatori ai variabilitatii, indicatori ai formei distributiei

Statistica



+ Font mai mare | - Font mai mic



INDICATORI STATISTICI





Notiunea de indicator si functiile indicatorilor


Cercetarea statistica a fenomenelor si proceselor socio-economice are ca obiectiv principal analiza aspectelor cantitative nemijlocit sesizabile pentru a afla si caracteriza esenta si calitatea acestora.

Definitie: Indicatorul statistic reprezinta expresia numerica a unor fenomene si procese social-economice, definite in timp, spatiu si structura organizatorica.17

Indicatorii statistici pot fi primari sau derivati.

Indicatorii primari exprima direct nivelul real de dezvoltare a caracteristicii cercetate, caracterizand fenomenul/procesul la modul cel mai general din punct de vedere cantitat Ei rezulta in urma observarii si centralizarii statistice a datelor individuale de masa, fie prin inregistrarea curenta, fie prin insumare partiala sau totala a datelor individuale de acelasi fel.

Indicatorii derivati se obtin prin prelucrarea marimilor absolute ale indicatorilor primari. Prelucrarea se face prin comparare, abstractizare, generalizare si alte procedee de calcul statistic.

Compararea se face prin diferenta sau prin raport. Prin diferenta se compara numai indicatorii absoluti cu acelasi continut si exprimati in aceeasi unitate de masura. Prin raport se pot compara indicatorii cu acelasi continut sau continut diferit, dar aflati in relatie de interdependenta.


1. INDICATORI AI TENDINTEI CENTRALE


Indicatorii tendintei centrale sunt indicatori sintetici cu ajutorul carora se exprima intr-o singura masura ceea ce este tipic, esential, stabil, obiectiv si caracteristic intr-o serie de date numerice.

Un indicator al tendintei centrale trebuie sa indeplineasca urmatoarele conditii:

sa fie definit in mod precis si obiectiv, eliminand aprecierea subiectiva a cercetatorului;

sa fie expresia tuturor observatiilor facute;

sa nu aiba caracter matematic prea abstract si sa posede proprietati simple si evidente;

sa poata fi calculat cu usurinta;

sa fie cat mai putin afectat de fluctuatiile de selectie (la extragerea mai multor esantioane dintr-o colectivitate generala, mediile sa nu fie sensibil diferite).

Indicatorii fundamentali ai tendintei centrale sunt: media aritmetica, modul si mediana.


1.1. Media aritmetica ()


Consideram ca termenul de medie este cel mai usor de inteles din intreaga statistica.

Au fost nenumarate situatiile in care am intalnit media: media la fizica pe trimestru sau semestru sa vedem daca am ramas corigenti sau am luat premiu, media


de la bacalaureat care ne ridica sau ne coboara sansele de admitere la facultate, la fel ca si media anilor de studiu sau media cheltuielilor zilnice care ne ajuta sa ne planificam mai bine bugetul.

Deci ce este media? Media aritmetica este indicatorul care se utilizeaza cel mai frecvent pentru caracterizarea tendintei centrale.

Media reprezinta valoarea care inlocuind toti termenii unei serii nu modifica nivelul totalizator si se calculeaza ca suma valorilor unei variabile raportata la numarul masuratorilor. Aceasta este media aritmetica, deoarece in statistica mai discutam si de media geometrica, media caracteristicilor alternative, media patratica, media rangurilor etc. Aceste concepte le intalnim insa mai rar in domeniul stiintelor socio-umane si prin urmare nu vom face decat sa le amintim.

(1) - pentru serie simpla

Exemplu: Varsta a 7 studenti de la facultatea de psihologie este de 25, 26, 32, 33, 40, 22, 26, 24. Varsta medie este :



In cazul in care datele au fost sistematizate intr-o serie de distributie de frecvente in care valorile/centrele intervalelor de variatie apar cu frecventele ni, atunci media aritmetica, numita si medie aritmetica ponderata este:

(2) pentru o serie cu distributie de frecvente.


Exemplu : Salariile date angajatilor (mil. lei) de catre 70 de firme in anul 2005 a avut urmatoarea distributie:

Interval

ni

20 - 40

10

40 - 60

15

60 - 80

10

80 - 100

5


Sa se calculeze media.


Raspuns : Fiind o serie cu distributie de frecvente vom aplica urmatoarea formula:

unde:

Xi = centrul de interval

Ni =frecventa absoluta

Observam ca in formula avem si necunoscute, adica Xi (centrul de interval) si va trebui sa-l calculam.

Interval

ni

Xi

20 40

10

30

40 - 60

15

50

60 - 80

10

70

80 - 100

5

90


X=

Xi =

Xi =


Xi =


Avand toate datele problemei, putem inlocui in formula, astfel :


→ Salariul mediu oferit este de 55 mil lei.

Nota: Pentru o serie de distributie de frecvente, media calculata pe baza frecventelor relative este egala cu media aritmetica determinata pe baza frecventelor absolute.


1.2. Modul (M0 )


Modul este categoria cu frecventa cea mai mare, el reprezinta valoarea cel mai des intalnita intr-o serie statistica sau cea care are cea mai mare frecventa de aparitie. Modul se mai numeste si dominanta seriei sau valoarea modala.

Grafic, intr-o histograma ori poligon al frecventelor el reprezinta valoarea de pe abscisa corespunzatoare varfului reprezentarii.

In cazul datelor cantitative, in determinarea modului se tine cont de felul in care

acestea au fost sistematizate.

Pentru o serie statistica simpla de forma valoarea modala, M0 = 32.

Pentru o serie de distributie de frecvente alcatuita dupa o variabila cantitantiva discreta, determinarea modului se face prin identificarea valorii careia ii corespunde frecventa maxima.

In cazul seriilor de distributie de frecvente pe intervale de variatie, determinarea modului presupune mai intai identificarea intervalului cu frecventa maxima:

unde:

reprezinta limita inferioara a intervalului modal;

reprezinta marimea intervalului modal;

d1 = diferenta dintre frecventa intervalului modal si a celui precedent;

d1= ;

d2 = diferenta din frecventa intervalului modal si a celui urmator;

d2 =;

Daca d1 = d2 atunci modul va fi egal cu centrul intervalului modal.


O serie de date statistice poate sa aiba una sau mai multe valori modale. O distributie cu un singur mod se numeste unimodala, daca are doua valori dominante se numeste bimodala, iar daca are mai mult de doua moduri se numeste multimodala.



Exemplu : Salariile date angajatilor de catre 70 de firme in anul 2005 a avut urmatoarea distributie:

Intervale

ni

10-20

20

20-30

10

30-40

10

40-50

15

50-60

25

60-70

10


M0 =

Intmod = 50-60 (intervalul a carui frecventa absoluta este cea mai mare)

= 50

d1 =

= frecventa intervalului modal

= frecventa intervalului anterior celui modal

d1 = 25 15 = 10

d2 =

= frecventa intervalului modal

= frecventa intervalului urmator celui modal

d2 = 25 - 10 = 15

Mo =58



1.3. Mediana (Me)

Mediana este o alta masura a tendintei centrale si reprezinta valoarea care imparte sirul de masuratori in doua parti egale; jumatate din sirul de date vor avea valori mai mici decat mediana in timp ce cealalta jumatate vor avea valori mai mari decat mediana.

Mediana este un indicator mediu de pozitie, care face parte din categoria cuartilelor. Ea prezinta valoarea/varianta din mijlocul unei serii de date, serie in care observatiile au fost ordonate crescator (sau descrescator). Mediana este situata in centrul (mijlocul) seriei.

Mediana poate fi folosita in caracterizarea tendintei centrale pentru o serie de date masurate pe o scala ordinala. Mediana ia in considerare doar pozitia observatiilor in serie, nu si magnitudinea lor efectiva.

Pentru a determina mediana introducem notiunea de ranguri, adica, numere de ordine asociate observatiilor (cea mai mica rang 1; cea mai mare rang n).

Locul medianei (LocMe) va fi rangul unitatii din mijlocul distributiei.

LocMe =

Pentru seriile simple la determinarea valorii din mijloc trebuie sa luam in consideratie situatiile:

a)          Daca n este un numar impar

pentru date cantitative mediana este exact valoarea din mijlocul seriei


Exemplu: In cazul unui sir impar, mediana este valoarea de la mijlocul unui sir. Daca reluam exemplul anterior, si mai adaugam un scor, obtinem:

20, 17, 14, 9, 18, 15, 19


Sirul are 7 valori. Ordonand sirul, obtinem:

9, 14, 15, 17, 18, 19, 20


De data aceasta, la mijlocul acestui sir gasim valoarea 17, valoarea medianei.

Observam ca n = 7.

LocMe = =

LocMe =4 → a 4-a valoarea din sirul de numere ordonate crecator sau descrescator reprezinta mediana → Me =17

Ordonand un sir, putem preciza pozitia fiecarui element in cadrul acelui sir.

Altfel spus, mediana nu este altceva decat pozitia rangului din mijloc in sirul ordonat de date. Intr-o serie de la 1 la 7, pozitia din mijlocul sirului este evident, pozitia 4. Acesta este de altfel si locul in care gasim mediana.


Scoruri: 9, 14, 15, 17, 18, 19, 20

Pozitia: 1, 2, 3, 4,5,6,7


b)     Daca n este un numar par, exista doua valori situate in mijlocul seriei.

daca datele sunt cantitative, mediana este media celor doua valori din mijloc



Exemplu: Se considera urmatorul sir de date:


20, 10, 15, 18, 21, 22


Pentru a calcula mediana, primul pas este acela de a ordona crescator sau descrescator aceste date. Ordonand crescator sirul de mai sus, obtinem:

10, 15, 18, 20, 21, 22


Sa se calculeze mediana.

Se ordoneaza datele crescator, astfel : 10, 15, 18, 20, 21, 22.

LocMe = = mediana se situeaza intre a treia si a patra valoare din serie.

Me =


Dupa definitia medianei, in cazul nostru avem 6 valori. Prin urmare, mediana va fi valoarea care imparte acest sir ordonat in doua parti egale. Fiind 6 valori, mediana este situata la limita primelor 3 valori. Deoarece sirul este un sir par, mediana se situeaza, in cazul nostru, intre valoarea 18 si valoarea 20, mai precis la valoarea 19.

c. Pentru o serie de distributie de frecvente variate determinarea medianei presupune calcularea mai intai a frecventelor cumulate. Prima frecventa cumulata mai mare decat (n+1)/2 (locul medianei) ne indica varianta mediana


Exemplul 1: Pentru 80 de familii dintr-un bloc s-au sistematizat date privind numarul membrilor de familie, rezultand distributia:

Numarul membrilor de familie

Numarul de familii

ni

Frecvente cumulate

Fci

1

12

12

2

23

35

3

30

65

4

8

73

5

7

80


80



LocMe =

adica, intre a 40-a si a 41-a familie prima frecventa cumulata mai mare decat 40,5 este 65 varianta trei membrii de familie reprezinta varianta mediana situata in mijlocul distributiei.

Pentru o serie de repartitie de frecvente pe intervale de variatie, mediana se va incadra in intervalul median, primul interval cu frecventa cumulata mai mare decat LocMe.

Exemplul 2: Se da distributia:

Intervale

ni

Fci

10-20

20

20

20-30

10

30

30-40

10

40

40-50

15

55

50-60

25

80

60-70

10

90



LocMe = ; n = 90

Me =


unde:

- limita inferioara a intervalului median

hMe marimea intervalului median

Fc(Me-1) - frecventa cumulata a intervalului anterior celui median

nMe frecventa absoluta a intervalului median

Me = = 43,66

Me = 43,66


Mediana prezinta unele avantaje fata de medie:

este mai putin afectata de valorile extreme, luand in considerare doar pozitia valorilor nu si magnitudinea lor efectiva;

poate fi folosita intr-o distributie pe intervale chiar si in cazul in care primul sau ultimul interval sunt deschise;

este un indicator ce poate fi folosit si pentru date ordinale;


Dezavantajele medianei:

mediana nu poate fi supusa la fel de usor calculelor algebrice;

media este preferabila in procesul de inferenta statistica.



2. QUARTILELE


Quartilele impart seria in patru parti egale, ele delimitand cele 25% din observatii. Quartilele sunt in numar de trei: Q1, Q2, Q3.

Q1 este cuartila inferioara;

Q2 este egala intotdeauna cu mediana;

Q3 este cuartila superioara;

Determinarea valorilor quartilelor se face adoptand formulele medianei:

Q1 =

unde:

= limita inferioara a intervalului quartilic;

= marimea intervalului quartilic;

= ;

= locul quartilei, primele 25% valori;

= frecventa cumulata a intervalului anterior celui quartilic;

= frecventa absoluta a intervalului quartilic;

;



;

= locul quartilei, ultimele 25% din valori;

Exemplul 1: Salariile date angajatilor de catre 70 de firme in anul 2005 a avut urmatoarea distributie:

Intervale

ni

Fci

10-20

20

20

20-30

10

30

30-40

10

40

40-50

15

55

50-60

25

80

60-70

10

90



Q1 =

Intervalul primul interval care are frecventa cumulata mai mare decat locul quartilei Q1

Q3 = primele 25% din firmele care ofera cele mai mari salarii.

Intervalul quartilei Q3 =

Q3= 155,3 → primele 25% din firmele care ofera cele mai mici salarii.



3. INDICATORI AI VARIABILITATII


Din aceasta grupa fac parte:

amplitudinea variatiei (absoluta si relativa);

abaterile individuale (absolute si relative).


Amplitudinea absoluta (A) se calculeaza ca diferenta intre nivelul maxim si nivelul minim al caracteristicii.

A = xmax - xmin


Amplitudinea relativa a variatiei (A%) se exprima in procente si se calculeaza ca raport intre amplitudinea absoluta a variatiei si nivelul mediu al caracteristicii.

A% =

Amplitudinea se foloseste la controlul calitatii produselor prezentand importanta si din punct de vedere metodologic, fiind folosit in prima faza a prelucrarii statistice la stabilirea numarului de grupe si a marimii intervalului de grupare.


3.1. Indicatorii sintetici ai variatiei


Indicatorii sintetici ai variatiei trebuie sa se bazeze pe toate observatiile, sa fie usor de calculat, cat mai putin afectati de fluctuatiile de selectie daca datele provin dintr-o cercetare statistica partiala pentru care trebuie verificata si reprezentativitatea esantionului.

Indicatorii sintetici ai variatiei sunt:

abaterea medie liniara;

abaterea medie patratica;

dispersia;

conflictul de variatie.


3.1.1. Abaterea medie liniara ()


Se mai numeste variatie medie, deviatie medie, abatere absoluta medie sau abatere liniara medie si se poate calcula atunci cand media este un bun indicator al tendintei centrale. Acest indicator informeaza asupra modului in care se abat, in valori absolute, rezultatele de la medie, acordand aceeasi pondere tuturor variabilelor. Abaterea medie se poate calcula pe date grupate sau pe date discrete.

Se calculeaza ca medie aritmetica simpla sau ponderata a abaterilor termenilor seriei de la media lor, luata in valoare absoluta.


Pentru o serie simpla:

Pentru o serie de distributie de frecvente absolute:

Pentru o serie cu frecvente relative, exprimate in procente:

.



Exemplu:

Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut in fata televizorului rezultand:

Timp (min)

Numar de persoane ni

xi

xi*ni

xi -

*ni

0-30

(Pana la 30)

47

15

705

-57,75

57,75

2714,25

30-60

51

45

2295

-27,75

27,75

1415,25

60-90

76

75

5700

2,25

2,25

171

90-120

24

105

2520

32,25

32,25

774

120 si peste

2

135

270

62,25

62,25

124,5

T=5199

Sa se calculeze abaterea medie liniara.



3.1.2. Dispersia (varianta) unei caracteristici ()


Atunci cand putem utiliza media, un indicator frecvent este indicatorul dispersiei sau indicatorul variantei (atentie, nu variatie ci varianta) notat cu sigma patrat pentru populatie sau s2 in cazul unui esantion.

Se calculeaza ca medie aritmetica simpla sau ponderata a patratelor abaterilor termenilor seriei fata de media lor.

Formula de calcul a dispersiei este urmatoarea, in care xi reprezinta valoarea masurata, x barat media iar N numarul de masuratori.

- pentru o serie simpla

pentru o serie cu frecvente absolute

pentru o serie cu frecvente relative, exprimate in procente

Exemplu: Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut in fata televizorului rezultand:


Timp (min)

Numar de persoane ni

xi

xi*ni

xi -

(xi-)2

(xi-)2*ni

0-30

(Pana la 30)

47

15

705

-42,45

1802

84694

30-60

51

45

2295

-12,45

155

7905

60-90

76

75

5700

17,55

308

23408

90-120

24

105

2520

47,55

2261

54264

120 si peste

2

135

270

77,55

6014

12028

T=11490 T=182299

Sa se calculeze dispersia.

,=57,45



3.1.3. Abaterea medie patratica (abaterea tip sau abaterea standard)


Se noteaza cu s in cazul unui esantion sau cu sigma in cazul unei populatii si o putem intalni sub numele de abatere etalon, abatere tip, abatere patratica medie. Acest indicator este cel mai precis si inteligibil pentru masura gradului de imprastiere

a rezultatelor in jurul tendintei centrale si contribuie la definirea distributiei normale. Poate fi calculat si dobandeste semnificatie numai atunci cand poate fi calculata media.

Se calculeaza ca medie patratica a abaterilor tuturor variantelor seriei de la media lor aritmetica si se noteaza .

Relatiile de calcul ale abaterii mediei patratice sunt:

pentru o serie simpla


Daca privim cu atentie aceasta formula, constatam ca expresia de sub radical nu este altceva decat varianta. Prin urmare, dupa ce calculam varianta, putem afla usor abaterea standard extragand radicalul de ordin doi din varianta.


pentru o serie de frecvente absolute

pentru o serie de frecvente relative, exprimate in procente


Exemplu:

30.19 minute



3.1.4. Coeficientul de variatie ()


Prezinta, mai intuitiv decat abaterea standard, gradul de imprastiere al rezultatelor in jurul mediei, deoarece este o expresie procentuala a impartirii abaterii standard la medie.

Se calculeaza ca raport intre abaterea medie patratica si nivelul mediu al seriei, deoarece abaterea standard se foloseste frecvent pentru masurarea abaterii medii.


Formula de calcul este:

sau (daca s-a calculat abaterea medie liniara )


Cu cat nivelul lui este mai apropiat de zero cu atat variatia este mai redusa, colectivitatea este mai omogena, media avand un grad mai ridicat de reprezentativitate; cu cat valoarea sa este mai departe de zero, cu atat variatia este mai intensa, colectivitatea mai eterogena, iar media are un nivel de semnificatie mai scazut.



4. INDICATORI AI FORMEI DISTRIBUTIEI


In cazul variablelor continue ce pot fi sistematizate in distributii de frecvente cu ajutorul intervalelor de grupare pe langa determinarea indicatorilor tendintei centrale si variabilitatii se pune problema sa studiem si modul in care valorile individuale sunt deplasate si centralizate comparativ cu tendinta centrala.

Forma unei distributii de frecvente se analizeaza comparativ cu distributia ideala, normala prin indicatori asimetrici (oblicitatii) si indicatori ai boltirii (excesului).



4.1. Indicatori ai asimetriei (oblicitatii)


Asimetria se observa prin reprezentarea grafica prin histograma sau poligonul frecventelor, dar poate sa fie masurata prin indicatori specifici.

Distributiile de frecvente pot fi:

perfect simetrice: (fig. 1a);

cu asimetrie pozitiva: (fig. 1b);

cu asimetrie negativa: (fig. 1c).





Fig.1 fig.2





Fig.3

Asimetria in valoarea absoluta se poate masura cu indicatorii:


Dar o distributie este caracterizata si prin variabilitatea datelor. O serie care are variabilitatea mai mica va fi mai pronuntata oblica, iar intr-o serie mai imprastiata oblicitatea se va atenua. Pentru aceasta vom calcula coeficientul de asimetrie Pearson:

coeficientul care ia valori pozitive in cazul curbelor alungite spre dreapta (asimetrie pozitiva) si valori negative in cazul curbelor alungite spre stanga (asimetrie negativa).

Coeficientul de asimetrie este nul pentru o distributie simetrica. El mai poate fi exprimat: .

Exemplu:

Presupunem ca pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul zilnic petrecut in fata televizorului, rezultand:


Timp (min)

Numar de persoane ni

xi

xi*ni

0-30

(Pana la 30)

47

15

705

30-60

51

45

2295

60-90

76

75

5700

90-120

24

105

2520

120 si peste

2

135

270

T=11490


Mo =xinfMo-hMo

Mo=60+30

ceea ce semnifica o asimetrie negativa moderata (coada mai lunga a distributiei tinde spre valori mici).

4.2. Coeficientul Yule


Coeficientul masoara gradul de asimetrie prin raportul dintre diferenta si suma abaterilor quartile si se calculeaza dupa formula alaturata. Observam ca, pentru a calcula acest coeficient, este necesar sa calculam pur si simplu cele trei quartile, dupa metoda prezentata intr-unul dintre capitolele anterioare.

unde Q1= Me-Q1

Q2=Q3-Me



Coeficientul poate lua, in general, valori de la -1 la +1 si indica marimea asimetriei negative sau pozitive. Cu cat valorile sunt mai apropiate de 0, cu atat distributia este mai simetrica. Cu cat se apropie de -1 sau de +1, ea devine tot mai asimetrica spre stanga sau spre dreapta.

Acest coeficient este foarte usor de calculat, insa tine cont doar de cateva valori valorile quartile si nu de toate valorile din distributie, fapt care ii limiteaza precizia si se considera ca este doar un coeficient elementar al simetriei.

Exemplu:

Pentru o distributie s-au stabilit urmatoarele rezultate:

Q1= 150

Me= 130

Q3=140.

Sa se calculeze valoarea coeficientului de asimetrie Yule.


Raspuns. Coeficientul de asimetrie yule se calculeaza dupa relatia:

Casq= = = = = -3

Q1= Me-Q1=130-150= -20

Q2=Q3-Me= 140-130= 10

Interpretare: Valoarea obtinuta, Casq= -3<0 arata ca distributia considerata este asimetrica la stanga.

Analiza oblicitatii (asimetriei)se poate face si pe baza momentelor centrate de ordinul 3:


Daca seriile de distributie cu asimetrie negativa sunt mai numeroase, valorile xi mai mici decat media, atunci abaterile sunt negative.

Daca seriile de distributie au asimetrie pozitiva sunt mai numeroase valorile xi mai mari decat media, atunci abaterile sunt pozitive.

Daca seriile de distributie sunt perfect simetrice, abaterile pozitive sunt tot atat de numeroase ca si cele negative.

O marime relativa a asimetriei se obtine prin raportarea la abaterea medie patratica ridicata la cub.



4.3. Coeficientul de asimetrie Fisher


Coeficientul de asimetrie Fisher, nu se bazeaza pe cateva elemente, precum coeficientul Yule, ci pe toate valorile din distributie si se calculeaza folosindu-se momentele centrate.


Coeficientul de asimetrie (Fisher): .

Sau


Coeficientul γ1 va avea valoare mai mare decat zero in cazul asimetriei pozitive, valoare mai mica decat zero in cazul asimetriei negative si va fi egal cu zero in cazul seriei perfect simetrice.

Atunci cand discutam de asimetrie, trebuie sa precizam o serie de relatii care apar intre indicatorii tendintei centrale, media, mediana si modulul.



Intr-o distributie simetrica, media, mediana si modul au exact aceleasi valori.

Caracteristica acestei distributii o reprezinta coincidenta absoluta a celor trei indicatori ai tendintei centrale. Dupa cum puteti observa in figura de mai sus, atat media, cat si mediana si modul, se afla in acelasi punct, la mijlocul distributiei.

Intr-o distributie asimetrica la dreapta (distributie skewness pozitiv, vezi figura alaturata), predomina scorurile mici. In acest caz, modulul este valoarea situata cel mai la stanga in sirul de date, iar mediana este mai mare decat media. Evident, mediana fiind valoarea care imparte sirul ordonat de date in doua parti egale, iar daca in distributie predomina scorurile mici, atunci scorurile mari sunt considerate ca scoruri extreme. Stim, de la analiza preciziei indicatorilor tendintei centrale, ca intr-o serie de date in care intalnim scoruri extreme mari, media tinde sa le puna in valoare. Iata ca acest fapt este ilustrat grafic in figura de mai sus. Observati relatia existenta intr-o asemenea distributie: Mo<Me<m. Aceasta relatie este relatia caracteristica a unei distributii asimetrice pozit

Intr-o distributie asimetrica la stanga (distributie skewness negativ, vezi figura alaturata), predomina scorurile mari. In acest caz, modul este valoarea situata cel mai la dreapta in sirul de date, iar mediana este mai mare decat media. Evident, mediana fiind valoarea care imparte sirul ordonat de date in doua parti egale, iar daca in distributie predomina scorurile mari, atunci scorurile mici sunt considerate ca scoruri extreme.

Stim, de la analiza preciziei indicatorilor tendintei centrale, ca intr-o serie de date in care intalnim scoruri extreme mici, media tinde sa le puna in valoare. Iata ca acest fapt este ilustrat grafic in figura de mai sus in care se observa relatia existenta.

Intr-o asemenea distributie: Mo>Me>m. Aceasta relatie este relatia caracteristica a unei distributii asimetrice negat


4.4. Boltirea


Boltirea masoara inaltimea, adica alungirea sau aplatizarea curbei, comparativ cu cea normala.

Asimetria pe orizontala, presupune, dupa cum am vazut, o deplasare a tendintei centrale spre stanga sau spre dreapta, catre scoruri mici sau catre scoruri mari. Aceasta este singura asimetrie posibila? Ei bine, nu. Exista si un fel de asimetrie verticala sau boltire.



Termenul folosit generic pentru acest concept este termenul de kurtosis (din limba greaca, kurtos = cocosat). Practic, boltirea se refera la aspectul cocoasei distributiei rezultatelor.

Cocoasa poate fi ascutita si atunci vorbim de o distributie ascutita sau leptocurtica, poate fi turtita, distributia turtita, plata sau platicurtica sau normala, distributie mezocurtica. O distributie normala este intotdeauna o distributie mezokurtica.

In figura de mai sus, distributia C este o distributie leptocurtica, ascutita. Distributia B este o distributie platicurtica, turtita, iar distributia A este o distributie normala sub aspectul boltirii, sau mezocurtica.

distributie leptocurtica, ascutita, arata ca datele sunt foarte grupate si apropiate de medie, lotul de subiecti avand un mare grad de omogenitate a scorurilor

O distributie platicurtica, plata, este o distributie in care rezultatele sunt foarte imprastiate fata de medie si indica un grad ridicat de eterogenitate a scorurilor.

Ati observat deja ca boltirea nu este altceva decat simetria pe axa verticala (OY), spre deosebire de simetria propriu zisa, deplasarea valorilor pe axa orizontala (OX).

Pentru curba normala (serie simetrica) β2 = 3. Daca β2 > 3, curba este mai ascutita decat cea normala (distributie leptocurtica). Daca β2 < 3, curba este mai turtita decat cea normala (dispozitie platicurtica).

Boltirea se mai poate masura si cu indicatorul: , care va avea valoarea zero daca distributia este normala, valoare pozitiva pentru distributie leptocurtica si valoare negativa pentru distributie platicurtica.


Exemplu: Distributia a 380 de firme dupa numarul de zile de asteptare pana la realizarea fuzionarii este:

Interval de variatie a numarului de zile

Numar de firme

40-80

50

80-120

70

120-160

90

160-200

100

200-240

50

240-280

20


380

Sa se calculeze oblicitatea si excesul repartitiei.

Rezolvare:

a. Coeficientul Yule

Asimetria este negativa moderata.

(Oblicitatea cu ajutorul momentelor centrate de ordinul 3 )

b. Boltirea

Curba este slab platicurtica (aplatizata) deoarece

Momentele de ordin r sunt valori ale caractersiticii urmarite care impart distributai observatiilor in r parti egale si au acelasi efectiv 1/r din numarul unitatilor .

Exemplu: mediana = quartila 2 = moment de ordin 2

quartila = quartila de ordin 4



5. Alegeti raspunsul corect

 



1. Media aritmetica, ca indicator fundamental al tendintei centrale:

a)     reprezinta valoarea care modifica nivelul totalizator al seriei;

b)     se foloseste cel mai frecvent si reprezinta suma valorilor raportata la numarul lor;

c)     se calculeaza adunand valorile existente;

d)     nu poate determina numarul de unitati din colectivitate.


2. Media aritmetica reprezinta:

a) valoarea pe care ar purta-o fiecare unitate statistica daca distributia ar fi eterogena;

b) valoarea pe care ar purta-o fiecare unitate statistica daca distributia ar fi omogena;

c) valoarea pe care ar purta-o fiecare variabila statistica daca distributia ar fi omogena.


3. Media aritmetica a unei sume dintre doua variabile este egala cu suma mediilor celor doua variabile, cand:

a)     cele doua variabile se afla intr-o relatie de interdependenta;

b)     cele doua variabile se afla intr-o relatie de inversa proportionalitate;

c)     cele doua variabile se refera la aceeasi colectivitate;

d)     cele doua variabile sunt independente;

e) cele doua variabile sunt direct proportionale.


4. Care dintre urmatoarele afirmatii privind media aritmetica este adevarata:

a)     suma patratelor tuturor abaterilor individuale ale termenilor seriei de la media lor aritmetica este zero;

b)     marimea mediei aritmetice este cuprinsa intre xmin si xmax doar daca seria prezinta o tendinta clara de asimetrie;

c)     pentru o serie de distributie de frecvente, media aritmetica, calculata pe baza frecventelor reduse de c ori, este mai mica decat media seriei initiale de c ori;

d)     media produsului a doua variabile aleatoare este egala cu produsul mediilor celor doua variabile;

e)     pentru o serie de distributie de frecvente, media calculata pe baza frecventelor relative este egala cu media aritmetica determinata pe baza frecventelor absolute.

5. Mediana, ca indicator statistic:

a) prezinta valoarea din mijlocul unei serii de date in care observatiile au fost ordonate crescator sau descrescator;

b) nu poate fi folosita in caracterizarea tendintei centrale pentru o serie de date masurate pe o scala ordinala;

c) nu are nici o legatura cu notiunea de rang.


6. 25% din salariatii unei inteprinderii au un salariu de cel mult 4 milioane lei. Aceasta valoare reprezinta:

a) quartila unu;

b) mediana;

c) quartila trei.


7. 75% din salariatii unei intreprinderii au un salariu de cel mult 7 milioane lei. Aceasta valoare reprezinta:

a) quartila unu;

b) mediana;

c) quartila trei.


8. 50% din salariatii unei intreprinderii au un salariu de cel mult 5 milioane lei. Aceasta valoare reprezinta:

a) quartila unu;

b) mediana;

c) quartila trei.


9. Intr-o repartitie normala valoarea fata de care 25% din valorile individuale sunt mai mici iar 25% din valorile individuale sunt mai mari este:

a. cuartila a doua;

b. cuartila a treia;

c. cuartila intai;

d. valoarea modala.


10. Media este o marime generalizata, adica, inlocuind fiecare nivel individual al caracteristicii de distributie cu nivel mediu:

a. suma termenilor seriei ramane aceeasi;

b. suma termenilor seriei se modifica;

c. suma termenilor seriei este nula.


11. Varianta (dispersia) de grupa masoara:

a) variatia sub influenta factorilor aleatori (variatia reziduala)

b) variatia sub influenta factorilor esentiali

c) variatia sub influenta factorilor aleatori si esentiali

12. Daca dorim sa obtinem un indicator al tendintei centrale pentru date masurate pe orice scala, vom determina:

a)     media aritmetica;

b)     modul;

c)     media geometrica;

d)     media ponderata.


13. Modul se afla dupa relatia:

a) Mo = xi - hMo * ;

b) Mo = xi + hMo * ;


c) Mo = xi-1 hMo


14. Care dintre urmatoarele variante nu reprezinta un indicator al tendintei centrale?

a)     mod;

b)     distributie de frecvente;

c)     mediana;

d)     medie;

e)     medie ponderata.


15. Daca dorim sa obtinem un indicator al tendintei centrale care sa nu fie afectat de valorile extreme, sa poata fi calculat pentru date masurate pe orice scala (cu exceptia celei nominale) si sa aiba o singura valoarea, vom calcula:

a)     media aritmetica

b)     modul;

c)     media geometrica;

d)     mediana;

e)     media ponderata.


16. Modul se utilizeaza pentru caracterizarea:

a. tendintei generale si gradului de asimetrie;

b. gradului de boltire;

c. gradului de concentrare.


17. Quartilele sunt marimi de pozitie care impart colectivitatea in:

a. n-1 parti egale;

b. 4 parti egale;

c. 5 parti egale;

18. In distributia de mai jos:


Interval

0 - 5

5 - 10

10 - 15

15 - 20

ni

3

7

15

20


Intervalul (15 20) reprezinta:

a.     intervalul median;

b.     intervalul modal;

c.      intervalul quartilic.


19. Rolul indicatorilor tendintei centrale ai unei distributii statistice este de a:

a) sintetiza datele

b) calcula marimile relative

c) aprecia gradul de dispersie al colectivitatii.


20. Asimetria se calculeaza dupa relatia:

a) As= Mo

b) As= 3(-Me)

c) As= 2(-Mo)


21. Coeficientul de asimetrie Yule, se calculeaza dupa relatia:

a) Casq= ; unde: Q1= Me-Q1

Q2=Q3-Me

a)                         b) Casq=

b)                         c) Casq=

22. Coeficientul de boltire se calculeaza dupa relatia:

a) β2= c) β2=

b) β2=


23. O distributie este mezocurtica atunci cand:

a) β2 = 3, γ2 = 0

b) β2 > 3, γ2 >0

c) β2 < 3, γ2 < 0


24. O distributie este leptocurtica atunci cand:

a) β2 = 3, γ2 = 0

b) β2 > 3, γ2 > 0

c) β2 < 3, γ2 < 0


25. O distributie este platicurtica atunci cand:

a) β2 = 3, γ2 = 0

b) β2 > 3, γ2 >0

c) β2 < 3, γ2 < 0


26. Abatarea medie liniara se calculeaza dupa relatia:

a) c)


b)


27. Coeficientul se utilizeaza pentru analiza statistica a:

a)     asimetriei;

b)     variatiei;

c)     boltirii;

d)     tendintei centrale;

e)     indicatorilor medii de pozitie.


28. Intr-o serie de repartitie pe intervale formata dupa o anumita variabila, valoarea sa modala este influentata de:

a) limitele inferioare si superioare ale intervalelor extreme;

b) de frecventele de aparitie ale intervalelor egale sau neegale;

c) de marimea egala sau neegala a intervalelor de variatie;

d) de limita inferioara a intervalului modal;

e) de limita inferioara, de frecventele intervalului modal, premodal si postmodal;


6. Probleme

 



1. Valoarea vanzarilor inregistrate de firma A pe parcursul a sapte (7)

zile, se prezinta astfel (in milioane lei) : 200, 250, 750, 1001, 1520, 1800, 2300.

Sa se calculeze valoarea medie zilnica a vanzarilor realizate de firma A.


2. Distributia dupa volumul vanzarilor zilnice (milioane lei) a unitatilor comerciale dintr-un judet in luna Ianuarie 2004, se prezinta astfel:


Volumul vanzarilor


0 - 10



10 - 20


20 - 30


30 - 40

Numarul unitatilor comerciale


50


20


10


5


-

Sa se calculeze nivelul mediu al vanzarilor zilnice.


3. Se da urmatoarea distributie:

Interval

ni

10-15

5

15-20

10

20-25

12

25-30

6

30-35

8

35-40

4




Sa se calculeze modul.



4. O firma inregistreaza, intr-o perioada de 5 zile, urmatoarele date privind volumul vanzarilor (milioane lei) : 5, 7, 20, 14, 9.

- sa se afle valoarea medianei (locul medianei)



5. O firma inregistreaza, intr-o perioada de 6 zile, urmatoarele date privind volumul vanzarilor (milioane lei) : 10, 40, 20, 15, 22, 35.

- sa se afle valoarea medianei .



6. Distributia familiilor dintr-un bloc dupa numarul de copii se prezinta astfel:


Numar copii

Numar familii (ni)

0

4

1

8

2

15

3

4

4

2

5

1

Total

34

Sa se calculeze valoarea medianei.



7. . Distributia muncitorilor unei firme dupa timpul consumat pentru realizarea produsului A, se prezinta astfel:


Timp necesar

- 30

30-60

60-90

90-120

120-15

150 -

Numar muncitori

25

50

60

45

15

5

Sa se calculeze valoarea medianei.


8. Distributia muncitorilor unei firme dupa timpul consumat, pentru realizarea produsului A se prezinta astfel:


Timpul necesar

(minute)

x (i-1) ; x (i)

Numar muncitori

Ni


Xi


F(ci)


0-30

25


15

25

30-60

50


45

75

60-90

60


75

135

90-120

45


105

180

120-150

15


135

195

150-180

5


165

200

total

200




Sa se calculeze valoarea quartelei unu.



9. Distributia muncitorilor firmei A dupa timpul consumat pentru realizarea produsuluiX se prezinta astfel:


Timp necesar

- 30

30-60

60-90

90-120

120-15

150 -

Numar muncitori

25

50

60

45

15

5


Sa se calculeze valoarea quartilei trei.




10. Distributia unui esantion de firme dupa cifra de afaceri lunara, X, in mil lei, in anul 2004, este prezentata astfel:


Xi-1; Xi

ni

176-178

20

178-180

25

180-182

40

182-184

35

184-186

30

186-188

10

Total

160


Sa se calculeze abaterea medie liniara.



11. . Daca: Q1= 128,13 mil. lei

Me= 137,86 mil. lei

Q3= 147,92 mil. lei

Atunci, coeficientul de asimetrie Yule este egal cu:

a)       141 si arata o distributie simetrica

b)      0, 016 si arata o distributie moderat asimetrica

c)       0,016 si arata o distributie puternic asimetrica.



12. Pentru o distributie s-au stabilit urmatoarele rezultate:

Q1= 150

Me= 130

Q3=140.

Sa se calculeze valoarea coeficientului de asimetrie Yule.



13. Pentru o distributie s-au obtinut urmatoarele rezultate:

m4 = 40.000 ; m2 = 100.

Sa se calculeze valoarea coeficientului de boltire.


14. Daca: m4 = 54059,44

m2 = 162,6

atunci coeficientul de boltire si interpretarea sa corecta sunt:

a)          β = 2,045 → arata o distributie usor platicurtica;

b)         β = 2,045 → arata o distributie usor leptocurtica;

c)          β = 2,045 → arata o distributie usor mezocurtica.



15. Pentru o distributie s-au obtinut urmatoarele rezultate:

Mo = 125 minute

= 130 minute

= 12 minute.

Sa se calculeze valoarea coeficientului empiric de asimetrie Pearson.



16. Distributia unui esantion de firme dupa cifra de afaceri lunara X, in milioane lei, in anul 2004, este:

Interval

176-178

178-180

180-182

182-184

184-186

186-188

ni

20

25

40

35

30

10


Sa se calculeze variatia (dispersia).



17. Pentru o distributie statistica s-a obtinut o valoare a coeficientului de boltire egala cu 2,5.

Sa se calculeze coeficientul Fisher.



18. Distributia unui esantion de firme dupa cifra de afaceri lunara, X, in mil. lei, in anul 2006, este:


Interval

176-178

178-180

180-182

182-184

184-186

186-188

ni

20

25

40

35

30

10

Sa se calculeze valoarea coeficientului de variatie.


7. Raspunsuri corecte

 




5. Raspunsuri corecte.


1. b - se foloseste cel mai frecvent si reprezinta suma valorilor raportata la numarul lor;


2. b - valoarea pe care ar purta-o fiecare unitate statistica daca distributia ar fi omogena;


3. c - cele doua variabile se refera la aceeasi colectivitate;


4. e - pentru o serie de distributie de frecvente, media calculata pe baza frecventelor relative este egala cu media aritmetica determinata pe baza frecventelor


5. a - prezinta valoarea din mijlocul unei serii de date in care observatiile au fost ordonate crescator sau descrescator;


6. c - quartila unu;


7. c - quartila trei;


8. c - cuartila a doua;


9. a - quartila trei;


10. a suma termenilor seriei ramane aceeasi;


11. a - variatia sub influenta factorilor aleatori (variatia reziduala);


12. b - modul;


13. c -Mo = xi-1 - hMo


14. b - distributie de frecvente;


15. d - mediana;


16. a tendintei centrale si gradului de asimetrie;


17. b patru parti egale;


18. b intervalul modal;


19. a - sintetiza datele;

20. b - As= 3(-Me);

21.a - Casq= ; unde: Q1= Me-Q1

Q2=Q3-Me

22. a - β2=;

23. a - β2 = 3, ∆ = 0;

24. b - β2 > 3, ∆ >0;

25. c - β2 < 3, ∆< 0;

26. b - ;

27. c. boltirii.

28. a - limitele inferioare si superioare ale intervalelor extreme;



6. Raspunsuri corecte.


1. Raspuns. Se foloseste formula mediei aritmetice pentru o serie simpla.

= = = 1117,28 milioane lei.

Interpretare: Valoarea medie a volumului vanzarilor zilnice este de 1117,28 milioane lei.


2. * Elementele de calcul sunt prezentate in tabelul urmator:


Volumul vanzarilor

x (i-1) ; xi


ni


x i


Xi . n

0-10

50

5

250

10-20

20


15

300

20-30

10

25

250

30-40

5

35

175

total

85


975


Xi= liminf + sau xi = =

Rsp. Nivelul mediu al vanzarilor zilnice se afla calculand media aritmetica care in cazul unei serii grupate pe intervale de variatie se calculeaza dupa relatia:


= = = = 11,47 milioane lei.


= 11,47 mil lei valoarea medie a volumului vanzarilor este de 11,47 mil lei.



3. Raspuns: Mo=

D1=nmo-nmo-1=12-10=2 ; D2=nmo-nmo+1 =12-6=6


4. Raspuns. Pentru o serie simpla cu numar impar de termeni, ordonati in sens crescator, mediana se afla depistand termenul central al seriei, in dreptul locului medianei.

Locme= ==3 → Me = 9 milioane lei.

Locul medianei este al 3-lea termen al sirului (5,7,9,14,20), deci Me=9 milioane.



5. Raspuns. Pentru o serie simpla cu numar par de termini, ordonati in sens crescator, mediana consta in calcului mediei aritmetice simple a celor 2 termeni centrali ai seriei.

Sirul de date ordonate crescator este: 10,15, 20, 22, 35, 40.

Me = = 21 milioane lei.


6. Raspuns. Locme=

Prima frecventa cumulata mai mare decat locul medianei ne indica valoarea medianei. In cazul nostru, prima frecventa cumulata mai mare decat 17,5 este 27, iar intervalul mdian va fi 2.

(ni=27) ≥ (Locme = 17,5)



7. Raspuns. Se calculeaza locul medianei.

Locme=

Me= xinfme+hme



Timp necesar

Numar muncitori

Fci

-30

25

25

30-60

50

75

60-90

60

135

90-120

45

180

120-150

15

195

150-

5

200



Me=60+30

Interpretare: Jumatate din numarul total al muncitorilor au consumat pentru realizarea produsului A pana la 72,75 minute, iar jumatate au consumat peste 72,75 minute


8. Raspuns: Q1=liminfQ1+hq1*

LocQ1===50,25

Se calculeaza frecventa absoluta cumulata crescator. Prima frecventa mai mare ca valoare deccat locul cuartilei 1 ne indica intervalul quartilic 1.

Liminf=30, deoarece intervalul Q1 este


hQ1=60 30 = 30

Fc(Q1-1) = 25

nQ1= 50

Q1= 30+30*=30+30*0,50 =30+15= 45

Interpretare: 25% din numarul total al muncitorilor consuma cel mult 45 de minute pentru realizarea unei piese.

9. Raspuns. Locq3=

Q3= xinfQ3+hQ3

Se calculeaza frecventa absoluta cumulata crescator. Prima frecventa mai mare ca valoarea deccat locul quartilei 3 ne indica intervalul quartilic 3.



Interpretare: 75% din numarul total al muncitorilor consuma cel mult 100,75 minute pentru realizarea unei piese.


10. Raspuns. Media = 181,75

Abaterea medie liniara = 2,42 mil lei → pe ansamblul firmelor se realizeaza o cifra de afaceri lunara care variaza in medie fata de nivelul mediu, cu 2,42 mil lei, in sens pozitiv sau negat

1.se calculeaza centrul de interval

2.se calculeaza media

3. se calculeaza abaterea medie liniara.

11. Raspuns. Casq= = =

= = 0,016


12. Raspuns. Coeficientul de asimetrie Yule se calculeaza dupa relatia:

Casq= = = -3

Q1= Me-Q1=130-150= -20

Q2=Q3-Me= 140-130= 10


Interpretare: Valoarea obtinuta, Casq= -3<0 arata ca distributia considerata este asimetrica la stanga.



13. Raspuns. Coeficientul de boltire se calculeaza dupa relatia:

β2= = = 4

m4= 40.000

m22 = (100)2 = 10.000



14. Raspuns. β2= = = = 2,045 si arata o distributie usor platicurtica deoarece

β2 < 3 ( curba este mai turtita decat cea normala).

Daca β2 = 3 → simetrie simetrica, iar daca β2 > 3 atunci aveam o distributie leptocurtica deoarece curba era mai ascutita decat cea normala.


15. Raspuns. Coeficientul empiric de asimetrie Pearson se determina dupa relatia:

Cas= == 0, 417.

Interpretare: Valoarea obtinuta, Cas = 0,417 >0, arata ca distributia considerata este puternic asimetrica la dreapta.( curbele sunt alungite spre dreapta).


16. Raspuns:


1. Se calculeaza centrul de interval.

Interval

ni

xi

xini

176-178

20

177

354

178-180

25

179

4475

180-182

40

181

7240

182-184

35

183

6405

184-186

30

185

5550

186-188

10

187

1870


2. Se calculeaza media.

=


17. Raspuns: (coeficientul de boltire)

Interpretare: Pentru < 0, distributia considerata este platicurtica.





17 Bentea, M, Munteanu, G , 2007 Elemente de statistica economica si sociala, Ed. Andrei Saguna, Constanta,p. 59



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1524
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved