Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
AgriculturaAsigurariComertConfectiiContabilitateContracteEconomie
TransporturiTurismZootehnie


Studiu de caz

Economie



+ Font mai mare | - Font mai mic



Studiu de caz

Un agent economic dispune de o retea de utilitati economice cu profilul alimentatie publica in care sunt angajati 500 de vanzatori.

Pentru cei 500 de vanzatori, considerati ca o colectivitate generala, s-a intocmit o baza de sondaj. Inscrierea in baza de sondaj a vanzatorilor s-a facut in ordine alfabetica, ceea ce constituie un criteriu aleator si li s-a dat un cod.



Considerand cei 500 de vanzatori ca formand o colectivitate, statistica, se cere:

  1. Sa se extraga printr-un procedeu de sondaj un esantion de 60 de unitati si sa se centralizeze nivelurile individuale ale fiecareia din variabilele prezentate potrivit continuturilor lor;
  2. Se se grupeze datele inregistrate la punctul precedent folosind gruparile simple pentru toate caracteristicile inregistrate pe intervale egale si neegale si sa se centralizeze datele conditionate de gruparile folosite. Sa se reprezinte grafic seriile obtinute;
  3. Sa se calculeze toate marimile relative posibile si sa se reprezinte grafic marimile obtinute folosind diagramele adecvate;
  4. Sa se calculeze indicatorii tendintei centrale, indicatorii variatiei si ai asimetriei pentru variabilele inregistrate;
  5. Sa se aplice regula adunarii dispersiilor pentru tabelul cu dubla intrare obtinut prin gruparea combinata;
  6. Sa se extinda rezultatele obtinute asupra intregii colectivitati pentru doua variabile daca P = 0.9973 (z=3);
  7. Sa se aplice metoda corelatiei si regresiei pentru datele din esantion. Sa se masoare gardul de intensitate al corelatiei. Pentru date negrupate se vor lua in calcul primele 10 unitati din esantion, la care se vor calcula si coeficientii de corelatie a rangurilor.

Rezolvare:

Din baza de sondaj s-a extras un esantion format din 60 de vanzatori. La extragere s-a folosit procedeul selectiei mecanice cu pas de numarare egal cu 8 si prima unitate extrasa a fost 89. S-au inregistrat datele privind sexul, varsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor lunare(zece mii lei) si salariul net lunar (mii lei) din luna mai 2002.

Cei 60 de vanzatori extrasi din baza de saondaj ne ofera pentru inceput urmatoarele informatii : au lucrat in total intr-o luna 1226 de zile - 10040 de ore, realizand o valoare de desfaceri de 1.765.370 zece mii lei. Iar fondul de salariu in aceasta luna pentru cei 60 de vanzatori a fost 174.689 mii lei.

3. Gruparea datelor inregistrate

3.1. Gruparea pe intervale de variatie egale

Gruparea pe intervale egale implica urmatoarele etape:

a) calculul amplitudinii absolute de variatie (A) care exprima imprastierea maxima a valorilor serei.

Axa = Xmax - Xmin; Axa = Ymax -Y min ;

Daca variatia este foarte mica ( in cazul nostru Axa ≤ 10) se va forma o distributie pe variante ( valabil in cazul caracteristicilor: varsta, zile lucarte).

b) stabilirea in parametrii intr-un anumit numar de grupe (r) se poate stabili astfel:

Ø      Daca variatia caracteristicii este relativ uniforma si volumul de unitati nu esate suficient de mare, numarul de grupe se poate fixa anterior (se vor folosi minimul 8 grupe pentru intervale egale);

Ø      Iar daca numarul grupelor nu este anterior cunoscut si volumul unitatilor este suficient de mare se recomanda stabilirea grupelor conform relatiei lui Sturgers,

r = 1+3,322log n

unde n - nr. caracteristicilor.

c) determinarea marimii intervalului de grupare (h), se calculeaza ca raport intre amplitudinea absoluta a variatiei si numarul de grupe:

h= Axa / r sau h = Xmax - Xmin / 1+3,222 log n

Nota: marimea intervalului (h) se rotunjeste la intreg in plus (ex.3,25

Prima grupa se porneste de la Xmin adaugandu-se succesiv marimea intervalului de grupare (h) rezultat din calculul anterior. Valoarea din stanga intervalului va fi considerata ca limita inferioara, iar valoarea din dreapta ca limita superioara. Valorile care formeaza limitele intervalelor se inregistreaza fie numai ca limita superioara fie ca limita inferioara pentru a evita inregistrari duble a caracteristicilor.

2A. Gruparea pe intervale egale a vanzatorilor dupa varsta

a)amplitudinea variatiei Axa = Xmax - Xmin = 27-19=8

Astfel obtinem o distributie pe variante.

Repartitia vanzatorilor dupa varsta

Repartitia vanzatorilor dupa varsta

(poligonul frecventelor)


Repartitia vanzatorilor dupa varsta

(curba cumulativa a frecventelor)


2C. Gruparea pe intervale egale a vanzatorilor dupa orele lucrate

a) Amplitudinea variatiei : Axa = Xmax - Xmin = 211-135 = 76

b) Numarul de grupe : r = 8

c) Marimea intervalului : h = Axa / r = 76 / 8 = 9.5 ≈ 10


1E. Gruparea pe intervale egale a vanzatorilor dupa salariul net lunar

a) Amplitudinea variatiei : Axa = Xmax - X min = 3692 - 2200 = 1492

b) Nr. de grupe: r= 8

c) Marimea intervalului : h = 1492/8 = 186.5

Repartitia vanzatorilor in functie de salariu net lunar (mii lei)

2.2. Gruparea vanzatorilor pe intervale neegale

Gruparea pe intervale egale ne-a permis structurarea colectivitatii pe grupe cat mai omogene. De asemenea, dupa cum s-a observat, gruparea statistica este cea mai semnificativa modalitate a sistematizarii datelor dupa o caracteristica numerica sau nominativa.

Sistematizarea datelor printr-o grupare pe intervale egale raspunde in primul rand necesitatii de sistematizare si omogenizare a datelor unei observatii statistice de masa si a caracterizarii independente a fiecarei variabile din propria observare.

Pentru analiza structurii colectivitatii pe grupe tipice se foloseste gruparea pe intervale neegale.

Gruparea pe intervale neegale presupune regruparea intervalelor egale.

Un prim principiu al gruparii pe intervale neegale este trecerea de la variatia liniara (interval de marime constanta) la variatia neuniforma a unor intervale de grupare din ce in ce mai mari. De exemplu, de la 8 grupe se poate trece la 5 grupe. Analizand situatia concreta se pot pastra primele 3 grupe, grupa a patra se obtine cumuland-o cu grupa a cincea , iar ultimile trei grupe se pot cupla. In cazul acesta se poate trece de la grupe pe variante la grupe pe intervale.

Un alt principiu de grupare are in vedere separarea unitatilor pe trei grupe: mici, mijlocii si mari; se porneste de la intervalul mediu al caracteristicii, care se calculeaza ca o medie aritmetica simpla sau ponderata pentru fiecare variabila in parte:

sau

Unde : xi - variabila;

n - numarul unitatilor inregistrate (in cazul nostru n=60 sau daca nu avem datele initiale folosim medi seriei in care, xi sunt valorile sau centrele de interval si cu frecventele seriei) .

Algoritmul de stabilire a celor 3 grupe du intervale neegale este urmatorul:

  • In grupa a II-a sunt cuprinse grupa care contine nevelul mediu al variabilei si intervalele invecinate cu aceasta;
  • Grupa I-a este formata din limita inferioara a primului interval si limita inferioara a intervalului II, iar
  • A III-a grupa intre limita superioara a intervalului II si limita superioara a ultimului interval de grupare.

2.2.A. Gruparea pe intervale neegale a vanzatorilor dupa varsta

Nivelul mediu

= 1366/60= 22,76 ani/vanz.

2.2.B. Gruparea pe intervale neegale a vanzatorilor dupa zilele lucrate

Nivelul mediu = 1232/60= 20,53 zile/vanz.

2.2.C. Gruparea pe intervale neegale a vanzatorilor dupa orele lucrate

Nivelul mediu = 10093/60= 168,21 ore/vanz.

2.2.D. Gruparea pe intervale neegale a vanzatorilor dupa valoarea desfacerii

Nivel mediu = 1780230/60 = 29670,5 mii lei/vanz.

2.2.E. Gruparea pe intervale neegale a vanzatorilor dupa salariu net lunar

Nivelul mediu = 175335/60 = 2922,25 zece mii lei/vanz.

2.3. Gruparea vanzatorilor dupa sex (gruparea dupa o variabila calitativa)

Structura pe sexe se determina conform relatiei:

2.4. Gruparea combinata a vanzatorilor dupa ore lucrate si salarii

Repartitia vanzatorilor dupa orele lucrate si salariu lunar

    **

 


**

 

**

 

******* ******

 

******** **

 

**

 

*** ******

 

*****

 

145 155 165 175 185 195 205 215

3. Calculul marimilor relative de structura

Din cele 5 marimi relative intalnite in statistica, in proiectul de fata se pot determina trei:

3.1. Marimile relative de structura se obtin ca raport intrte parte si intreg. Forma cea mai obisnuita de exprimare a marimilorrelative de structura este cea a procentelor care arata cate unitati din indicatorul raportat revin la 100 unitati ale indicatorului de baza raportare. Se pot calcula atat pe baza frecventelor absolute si in acest caz au sens de frecvente relative (ni

cat si pe baza valorilor centralizate privind varsta, zilele lucrate, orele lucrate, volumul desfacerilor si salariul net, obtinandu-se in acest caz ponderea sau greutatea specifica ( gi ) a unei valori ( xi ) in totalul valorilor colectivitatii ( ):

3.2. Marimile relative de coordonare se obtin ca raport intre doua grupe sau intre doua colectivitati ce coexista in spatiu.

Pentru o colectivitate impartita in doua grupe pentru care nivelul pe grupe al variabilei studiate este xA si xB :

K A/ B = xA / xB sau K B/ A = xB / xA

Daca sunt mai multe grupe, se alege una ca baza de comparatie si se raporteaza, pe rand, fiecare grupa de baza aleasa.

3.3. Marimile relative de intensitate se obtin prin raportarea a doi indicatori cu continut diferit dar intre care exista o relatie de interdependenta.

La nivel partial: Xi = Yi / Zi ;

La nivelul ansamblului:

3.A. Calculul marimilor relative pe baza repartitiei vanzatorilor dupa varsta.

Repartitia timpului lucrat (in zile si ore), a valorii desfacerii

si a fondului de salarii si a structurii acestora

In functie de varsta

Interpretare: Cei mai tineri alcatuiesc 30% din totalul angajatilor, lucreaza 29,3% respectiv 29% din totalul zilelor si orelor lucrate, realizeaza 29,9% din valoarea desfacerii si primesc 28,7% din fondul de salarii.

Repartitia timpului lucrat (in zile si ore), a valorii desfacerii

si a fondului de salarii si a raportului acestora fata de

grupa celor mai tineri, in functie de varsta

Intervalul de variatie al

varstei

Nr. vanz.

ni

Valori centralizate pentru

Marimile relative de coordonare

Zile lucr.

xi

Ore lucr.

yi

Val. Desf.

zi

Fond salariu    si

Nr. vanz.

ni/n1

Zile lucr.

xi/x1

Ore lucr.

yi/y1

Val. desf

zi/z1

Fond sal.

si/s1

Total

Repartitia timpului lucrat (in zile si ore), a valorii desfacerii

si a fondului de salarii pe total si in medie pe un vanzator,

in functie de varsta salariatului

Intervalul de variatie al

varstei

Nr. vanz.

ni

Valori centralizate pentru

Marimile relative de intensitate

Zile lucr.

xi

Ore lucr.

yi

Val. Desf.

zi

Fond salariu    si

Zile lucr.

xi/n1

Ore lucr.

yi/n1

Val. desf

zi/n1

Fond sal.

si/n1

Total

3D. Calculul marimilor relative pe baza repartitiei vanzatorilor dupa valoarea desfacerii

Repartitia timpului lucrat (in zile si ore) a fondului de salarii

si a structurii acestora in functie de valoarea desfacerii

Interval de variatie

a valorii

desf

Calificativ

Marimi relative de structura %

Frecvente relative

ni

gi

Zile lucr.

Ore lucr.

Fond salarii

mica

medie

mare

Total

Repartitia timpului lucrat (in zile si ore) a fondului de salarii si a raportului acestora fata de prima grupa, in functie de valoarea desfacerii

Intervalul de variatie a

valorii desf

Nr. vanz.

ni

Valori centralizate pentru

Marimile relative de coordonare

Zile lucr.

xi

Ore lucr.

yi

Fond salariu    si

Nr. vanz.

ni/n1

Zile lucr.

xi/x1

Ore lucr.

yi/y1

Fond sal.

si/s1

Total

Intervalul de variatie a

valorii desf

Nr. vanz.

ni

Valori centralizate pentru

Marimile relative de intensitate

Zile lucr.

xi

Ore lucr.

yi

Fond salariu    si

Zile lucr.

xi/n1

Ore lucr.

yi/n1

Fond sal.

si/n1

Total

4. Caracterizarea statistica a repartitiilor obtinute

Caracterizarea statistica in cazul dat se refera la determinarea:

a) Indicatorilor tendintei centrale

Ø      Media aritmetica

Ø      Modul (modulul, dominanta)

Ø      Mediana (Me)

b) Indicatorii sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (

Ø      Dispersia :


Ø      Abaterea medie patratica


Ø      Coeficientul de variatie (v):

respectiv

Ø      Coeficientul de asimetrie

sau

4.A. Repartitia vanzatorilor dupa varsta

Varsta

(ani)

Nr. vanzatori

xi ni

Frecvente cumulate

crescator

Total

a) Calculul indicatorilor tendintei centrale :

Ø      Media aritmetica

Ø      Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecventa maxima.

Mo= 24ani/vanz

Ø      Mediana (Me)

Locul medianei: U(Me) = (60+1)/2=30,5

Variabila 23 ani este prima a carei frecventa cumulata este mai mare de 30,5.

Me=23 ani/vanz

b) Indicatorii sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (

113,38/60=1,89ani/vanz

Ø      Dispersia :


= 302,69/60 = 5,04

Ø      Abaterea medie patratica

= 2,24 ani/vanz

Ø      Coeficientul de variatie (v):

sau

v' si v <35% - seria este omogena si media este reprezentativa pentru serie

Ø      Coeficientul de asimetrie

sau

Rezulta asimetrie negativa foarte moderata

4.B. Repartitia vanzatorilor dupa zilele lucrate

Zile

lucrate

Nr. vanzatori

xi ni

Frecvente cumulate

crescator

Total

a) Calculul indicatorilor tendintei centrale

Ø      Media aritmetica

= 1232/60 = 20,53 zile/vanz

Ø      Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecventa maxima

Mo= 22 zile/vanz

Ø      Mediana (Me)

Locul medianei: U(Me) = (60+1)/2=30,5

Variabila 21 ani este prima a carei frecventa cumulata este mai mare de 30,5.

Me=21 ani/vanz

b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (

= 121,64/60 = 2,02 zile/vanz

Ø      Dispersia :


= 318,89/60 = 5,31

Ø      Abaterea medie patratica

= = 2,30 zile/vanz

Ø      Coeficientul de variatie (v):

respectiv

v' si v <35% - seria este omogena si media este reprezentativa pentru serie

Ø      Coeficientul de asimetrie

sau

Rezulta asimetrie negativa foarte moderata.

4.C. Repartitia vanzatorilor dupa orele lucrate

Zile

lucrate

Nr. vanzatori

xi

xi ni

Frecvente cumulate

crescator

Total

a) Calculul indicatorilor tendintei centrale

Ø      Media aritmetica

= 10100/60 = 168,3 ore/vanz

Ø      Modul (modulul, dominanta)

Locul Mo - intervalul cu frecventa maxima (175-185)

= 175+10 179,28 ore/vanz

Ø      Mediana (Me)

Locul medianei: U(Me) = (60+1)/2=30,5

Deci intervalul (165-175) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.

= 165+10160,41 ore/vanz

b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (


ore/vanz

Ø      Dispersia :


= 21033,4/60 = 350,55

Ø      Abaterea medie patratica

= 18,72 ore/vanz

Ø      Coeficientul de variatie (v):

=     respectiv

=

v' si v <35% - seria este omogena si media este reprezentativa pentru serie

Ø      Coeficientul de asimetrie

=     sau

=

Rezulta o asimetrie oblica la stanga

4.D. Repartitia vanzatorilor dupa valoarea desfacerii (zece mii lei)

Grupe de vanzatori dupa val. desf (zece mii lei)

Nr. vanz.

xi

xi ni

Frecvente cumulate

crescator

Total

a) Calculul indicatorilor tendintei centrale

Ø      Media aritmetica

= 1778950/60 = 29649,16 zece mii lei / vanz

Ø      Modul (modulul, dominanta)

Locul Mo - intervalul cu frecventa maxima (30012-31990)

= 30012+1978 zece mii lei/vanz

Ø      Mediana (Me)

Locul medianei: U(Me) = (60+1)/2=30,5

Prin urmare intervalul (30012-31990) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.

zece mii lei/vanz

b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (

220997,36/60= 3683,28 zece mii lei /vanz

Ø      Dispersia :


= 1114817897.9/60 = 18580298,2

Ø      Abaterea medie patratica

= 4310,4 zece mii lei/vanz

Ø      Coeficientul de variatie (v):

=     respectiv

v' si v <35% - seria este omogena si media este reprezentativa pentru serie

Ø      Coeficientul de asimetrie

sau

Rezulta asimetrie negativa moderata.

4.E. Repartitia vanzatorilor dupa salariu net (mii lei)

Grupe de vanzatori dupa salariu net lunar (mii lei)

Nr. vanz.

xi

xi ni

Frecvente cumulate

crescator

Total

a) Indicatorilor tendintei centrale

Ø      Media aritmetica

= 175610/60 = 2926,83 mii lei/vanz

Ø      Modul (modulul, dominanta)

Locul Mo - intervalul cu frecventa maxima (2948-3135)

= 2948+187 mii lei/vanz

Ø      Mediana (Me)

Locul medianei: U(Me) = (60+1)/2=30,5

Prin urmare intervalul (2948-3135) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.

Me=2948+187 mii lei/vanz

b) Indicatorii sintetici ai variatiei si ai simetriei:

Ø      Abaterea medie liniara (

18551,6/60= 309,1 mii lei/vanz

Ø      Dispersia :


= 8167801,7/60 = 136130

Ø      Abaterea medie patratica


= lei/vanz

Ø      Coeficientul de variatie (v):

=     respectiv

Ø      Coeficientul de asimetrie

=     sau

=

Rezulta asimetrie negativa foarte moderata.

Indicatorii tendintei centrale, de variatie totala si de asimetrie

pentru variabilele inregistrate in esantion

Pentru interpretarea rezultatelor se vor trece indicatorii obtinuti intr-un tabel sintetic.

Indicatorii tendintei centrale, de variatie totala si de asimetrie pentru variabilele inregistrate in esantion

Denumirea

indicatorului

Variabilele inregistrate

Varsta

Zile lucr.

Ore lucr.

Val. desf.

Sal. net lunar

Media aritmetica

Modul

Mediana

Abaterea medie liniara

Abaterea medie patratica

Dispersia

Coef. de variatie % dupa:

Coef. de asimetrie dupa:

Mo

Me

5. Aplicarea regulii de adunare a dispersiilor si verificarea gradului de semnificatie a factorului de grupare

Grupe de vanzatori dupa ore lucrate

Subgrupe de vanzatori    dupa salariul net (mii lei)

Total

Total

Mediile de grupa

mii lei /vanz

mii lei/vanz

mii lei/vanz

mii lei /vanz

mii lei/vanz

mii lei/vanz

mii lei/vanz

Media pe total (generala)

- pe baza mediilor de grupa

   

mii lei/vanz

c. Dispersia de grupa sau dispersia partiala

d. Media dispersiilor de grupa

e. Dispersia dintre grupe

f. Dispersia totala

sau regula de adunare a dispersiilor:

Pe baza regulii de adunare a dispersiilor se pot calcula alti doi indicatori statistici cu caracter de marimi relative de structura, care exprima ponderea celor doua categorii de factori.

Coeficientul de determinatie

   

Coeficientul de nedeterminatie dupa relatia

Pe baza mediilor si a abaterilor medii patratice, determinate pe grupe si pe total, se pot obtine informatii referitoare la gradul de omogenitate al acestora cu ajutorul coeficientilor de variatie corespunzatori, calculati dupa relatiile:

Coeficientul de variatie se calculeaza ca raport intre abaterea medie patratica si media variabilei respective si se exprima in procente:

unde

%

%

%

%

%

%

Coeficientul de variatie pe total

unde

Pentru interpretarea rezultatelor se vor trece indicatorii obtinuti intr-un tabel sintetic

Indicatorii tendintei centrale si de variatie

Grupe de vanzatori dupa ore lucrate

(mii lei /vanz)

(mii lei /vanz)

Total

Intrucat valoarea coeficientului de variatie este mai mica de 35%, putem aprecia ca toate cele 8 grupe de salarii nete atribuite dupa valoarea desfacerii sunt omogen. Daca ierarhizam grupele din punct de vedere a omogenitatii dintre cele mai omogene grupe sunt grupele VI si VII, iar cea mai putin omogena este III deoarece aici coeficientul de variatie este cel mai mare. Paralel cu aceasta rezulta ca media, ca indicator al tendintei centrale, este semnificativa, valorile seriei gravitand in jurul mediei grupei.

6. Estimarea limitelor pentru media colectivitatii totale si pentru nivelul totalizat al caracteristicii

Eroarea medie de reprezentativitate:

pentru selectie repetata:

pentru selectie nerepetata:

Eroarea limita maxima admisa

pentru selectie repetata

pentru selectie repetata

Intervalul de incredere al mediei colectivitatii generale:

Intervalul de incredere al nivelului totalizat al caracteristicii:

6 .1. Estimari pentru repartitia vanzatorilor dupa valoarea desfacerilor

Selectie repetata

Selectie nerepetata

Eroarea medie de reprezentativitate

zece mii lei

=522,55 zece mii lei

Eroarea limita maxima admisa

zece mii lei

zece mii lei

Intervalul de incredere al mediei

zece mii lei

zece mii lei

Intervalul de variatie al nivelului totalizat

zece mii lei

zece mii lei

Nota: Valorile necesare (media () si dispersia ()) sunt la punctul 4.D

6 .2. Estimari pentru repartitia vanzatorilor dupa salariul net lunar

Selectie repetata

Selectie nerepetata

Eroarea medie de reprezentativitate

mii lei

mii lei

Eroarea limita maxima admisa

mii lei

mii lei

Intervalul de incredere al mediei

mii lei

mii lei

Intervalul de variatie al nivelului totalizat

mii lei

mii lei

Nota: Valorile necesare (media () si dispersia ()) sunt la punctul 4.E

7. Analiza corelatiei dintre valoarea desfacerii si salariu

Corelatia liniara simpla (date negrupate)

Se aplica pentru primele 10 unitati din esantion, privind numarul de ore lucrate (xi) si salariul net lunar (yi ) - mii lei. Seria se va ordona crescator dupa numarul de ore lucrate (xi) mentinandu-se salariul net lunar (yi ) corespunzator.

Dintre metodele simple de cercetare a legaturilor statistice recurgem la :

a)    Metoda seriilor paralele interdependente

Nr. crt

Ore lucrate

(xi)

Salariul net lunar

(mii lei)

(yi)

Concluzie: Valorile xi fiind ordonate crescator se poate observa ca si valorile yi cresc in cea mai mare parte, ceea ce sugereaza o legatura directa.

b)    Metoda grafica este o alta cale de a stabili legatura dintre fenomene

Pentru a obtine graficul de corelatie, denumit si corelograma, valorile caracteristicii factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observata a celor doua caracteristici se reprezinta grafic printr-un punct.


Graficul de asemenea confirma o legatura directa de forma liniara.

Metoda grafica este utilizata cu bune rezultate pentru alegerea functiei analitice care se studiaza (in cazul regresiei si corelatiei)

Metodele de studiere a legaturilor prezentate anterior au ca deficienta principala faptul ca desi permit constatarea legaturii si caracterulul ei, nu o pot masura printr-un indicator sintetic. Acest inconvenient este inlaturat prin utilizarea metodei regresie.

Metoda regresiei constituie o metoda statistica analitica de cercetare a legaturii dintre variabile cu ajutorul unor functii denumite functii de regresie.

Notand cu Y variabile dependenta si cu x1 , x2 xn variabilele independente obtinem ecuatia de regresie y = f (x1 , x2 xn).

In cazul de fata am apelat la modelul de regresie unifactoriala liniar considerand legatura dintre y si x de tipul yxi = a +bxi. Parametri ecuatiei in acest caz se determina prin rezolvarea urmatorului sistem de ecuatii:

Daca se foloseste metoda determinantilor se obtine:

Datele necesare calcularii celor doi parametri sunt prezentate in tabelul de mai jos.

Nr ctr.

xi

yi

xiyi

Yxi=-259,98+18,88xi

Total

Functia de regresie este: Yxi=-259,98+18,88xi

a)    Raportul de corelatie liniara simpla se calculeaza cu formula:

Nr. crt

xi

yi

Yxi

(yi - Yxi)2

(yi - )2

Unde: 29532/10=2953,2 mii lei/vanz

b)    Metoda coeficientului de corelatie

Intensitatea legaturii se masoara prin coeficientul de corelatie (ry/x).

Rezulta ca legatura dintre aceste doua variabile este directa (rz/x>0) si puternica. Exista legatura liniara intensa deoarece ry/x=Ry/x.

c)     Calculul coeficientului de corelatie a rangurilor

Coeficienul de corelatie a rangurilor propus de Spearman:

in care: di - reprezinta diferenta intre rangurile perechii de valori (xi,yi);

n - numarul de perechi de valori.

Coeficientul de corelatie a rangurilor propus de Kendall :

in care

in care: Pi - numarul rangurilor mai mari care urmeaza rangului curent pentru variabila dependenta;

Qi - numarul rangurilor mai mici care urmeaza rangului curent pentru variabila dependenta.

Coeficienul de corelatie a rangurilor propus de Spearman:

Coeficientul de corelatie a rangurilor propus de Kendall :

Calculul coeficientilor de corelatie a rangurilor

Nr crt

xi

yi

Ranguri

di=rxi-ryi

di2

Pi

Qi

Pi-Qi

rxi

ryi

total

ANEXA

Identificarea legii de repartitie

(verificarea ipotezelor statistice)

Pe baza acestor caracteristicilor (determinate empiric, ale) variabilei aleatoare , respectiv pe baza indicatorilor empirici, se formuleaza ipoteze privind tipul legii de repartitie a variabilei aleatoare si valorile parametrilor asociati legii respective. Verificarea (sau validarea) acestor ipoteze se concretizeaza in identificarea legii de repartitie (distributie) asociate lui .

Verificarea ipotezelor statistice consta in compararea distributiei empirice (numerice) - de natura/tipologie necunoscuta - cu o alta distributie, empirica (numerica) sau analitica, dar de natura/tipologie cunoscuta, potrivit unor teste numerice statistice. In conditiile invalidarii testelor respective, se infirma identitatea naturii/tipologiei celor doua distributii comparate. Daca insa testele sunt verificate/validate, se accepta faptul ca cele doua distributii pot avea aceeasi natura (respectiv pot fi de acelasi tip).

Se considera, asadar, doua esantioane/selectii distincte, , , si respectiv, , , unde si sunt volumele celor doua esantioane/selectii. Prelucrarile statistice preliminare au fost efectuate pe acelasi domeniu de definitie , utilizand aceeasi diviziune a acestuia (pentru ambele selectii) . Au rezultat, la nivelul fiecarui subinterval , , si valori experimentale (defectari/cedari) observate, corespunzatoare celor doua selectii investigate.

In urma prelucrarilor statistice preliminare, au fost determinate densitatile de probabilitate empirice si , functiile de repartitie empirice si , valorile medii empirice si , dispersiile empirice corectate si , respectiv abaterile patratice medii empirice corectate si , aferente celor doua selectii/esantioane.

Se urmareste identificarea legii (legilor) de repartitie aferente celor doua selectii si determinarea valorilor parametrilor asociati legii (legilor) respective, prin intermediul metodelor corespunzatoare verificarii ipotezelor statistice. Potrivit acestora, se admite egalitatea caracteristicilor de tip valoare numerica (medie sau dispersie) sau, dupa caz, identitatea legilor de repartitie (respectiv identitatea densitatii de probabilitate sau a functiei de repartitie) aferente celor doua esantioane/selectii studiate. In urma evaluarii unui parametru statistic specific, se determina probabilitatea ca ipoteza egalitatii/identitatii sa fie adevarata. Daca valoarea acestei probabilitati este mica (ex. 0,01 , maximum 0,05), se poate afirma ca ipoteza statistica - a egalitatii caracteristicilor de tip valoare numerica sau a identitatii legilor de repartitie - este falsa. O valoare ridicata a probabilitatii respective (ex. 0,80) nu inseamna neaparat ca ipoteza admisa este adevarata.

Ipoteza identitatii legilor de repartitie poate fi utilizata si in circumstantele compararii unei distributii empirice (obtinuta prin prelucrarea statistica a unui esantion) cu o lege de repartitie teoretica data (etalon).

1. Testul t (Student) pentru confirmarea diferentei dintre

valorile medii caracteristice

1.1. Cazul in care se admite egalitatea dispersiilor

Metodologia care trebuie urmata este:

a) Se calculeaza eroarea standard a diferentei mediilor:

;

b) se calculeaza parametrul statistic t:

;

c) se stabileste numarul total al gradelor de libertate:

n n1 n2

d) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi valoare medie a variabilei aleatoare:

in care:

reprezinta functia de probabilitate corespunzatoare distributiei Student, iar

este functia Beta de argumente a si b .

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01 , maximum 0,05), se poate afirma ca valorile medii ale celor doua esantioane difera semnificativ.

1.2. Cazul in care se considera ca dispersiile esantioanelor difera semnificativ

Metodologia care trebuie urmata este:

a) se calculeaza parametrul statistic t:

;

b) se evalueaza numarul echivalent (fractionar) total al gradelor de libertate:

;

c) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi valoare medie a variabilei aleatoare, utilizand aceleasi formule .

2. Testul F pentru confirmarea diferentei dintre

dispersiile caracteristice

Metodologia care trebuie urmata este:

a) se determina parametrul statistic (supraunitar) F si numerele gradelor de libertate caracteristice:

, daca

si respectiv,

, daca ;

b) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi dispersie a variabilei aleatoare:

in care

este functia Beta incompleta de parametru si argumente a, respectiv b.

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca dispersiile celor doua esantioane difera semnificativ.

3. Compararea distributiilor pentru doua esantioane distincte

3.1. Testul pentru confirmarea diferentei dintre cele doua distributii

Metodologia care trebuie urmata este:

a) se calculeaza parametrul statistic

;

b) se stabileste numarul gradelor de libertate:

, daca ,

respectiv   

, daca ;

c) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:

,

in care:

reprezinta complementara functiei Gamma incomplete de argument a si parametru , iar

este functia Gamma de argument a.

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributiile aferente celor doua esantioane difera semnificativ.

3.2. Testul Kolmogorov - Smirnov (K-S) pentru confirmarea diferentei dintre cele doua distributii

Metodologia care trebuie urmata este:

a) se determina valoarea maxima a diferentei absolute dintre functiile de repartitie empirice aferente celor doua esantioane:

;

b) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:

in care

reprezinta functia Kolmogorov - Smirnov (K-S) de argument l

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributiile aferente celor doua esantioane difera semnificativ.

4. Compararea unei distributii empirice cu o lege

de repartitie teoretica (etalon)

Se considera o lege teoretica - si cunoscuta - de repartitie a variabilei aleatoare , definita prin functia de repartitie , si prin densitatea de probabilitate , . Se compara distributia empirica aferenta primului esantion investigat (esantionul nr. 1) cu distributia etalon considerata.

4.1. Testul pentru confirmarea diferentei dintre cele doua distributii

Metodologia care trebuie urmata este:

a) se evalueaza, pentru fiecare subinterval de discretizare , , numarul teoretic (de obicei fractionar) de valori numerice observabile (respectiv de cedari/defectari), potrivit legii de repartitie teoretice (etalon) considerate:

, ;

b) se calculeaza parametrul statistic

;

c) se stabileste numarul gradelor de libertate:

;

d) se evalueaza probabilitatea ca legea de repartitie teoretica (etalon) sa corespunda esantionului nr.1 investigat, utilizand aceleasi formule .

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributia aferenta esantionului nr. 1 difera semnificativ de repartitia teoretica considerata.

4.2. Testul Kolmogorov - Smirnov (K-S) pentru confirmarea

diferentei dintre cele doua distributii

Metodologia care trebuie urmata este:

a) se determina valoarea maxima a diferentei absolute dintre functia de repartitie empirica (esantionul nr.1) si functia de repartitie teoretica considerata:

b) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:

functia Kolmogorov - Smirnov (K-S) fiind explicitata prin intermediul aceleiasi formule .

Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributia aferenta esantionului nr. 1 difera semnificativ de repartitia teoretica considerata.

BIBLIOGRAFIE

1. Elena-Maria Biji, Eugenia Lilea, Mihaela Vatui, Emilia Gogu, STATISTICA APLICATA IN ECONOMIE, Editura Oscar Print, 2001

2. . Elena-Maria Biji, Eugenia Lilea, Mihaela Vatui, Emilia Gogu, APLICATII STATISTICE IN STUDIUL FENOMENELOR ECONOMICE, Editura Oscar Print, Bucuresti 2003



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 1697
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved