CATEGORII DOCUMENTE |
Agricultura | Asigurari | Comert | Confectii | Contabilitate | Contracte | Economie |
Transporturi | Turism | Zootehnie |
Studiu de caz
Un agent economic dispune de o retea de utilitati economice cu profilul alimentatie publica in care sunt angajati 500 de vanzatori.
Pentru cei 500 de vanzatori, considerati ca o colectivitate generala, s-a intocmit o baza de sondaj. Inscrierea in baza de sondaj a vanzatorilor s-a facut in ordine alfabetica, ceea ce constituie un criteriu aleator si li s-a dat un cod.
Considerand cei 500 de vanzatori ca formand o colectivitate, statistica, se cere:
Rezolvare:
Din baza de sondaj s-a extras un esantion format din 60 de vanzatori. La extragere s-a folosit procedeul selectiei mecanice cu pas de numarare egal cu 8 si prima unitate extrasa a fost 89. S-au inregistrat datele privind sexul, varsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor lunare(zece mii lei) si salariul net lunar (mii lei) din luna mai 2002.
Cei 60 de vanzatori extrasi din baza de saondaj ne ofera pentru inceput urmatoarele informatii : au lucrat in total intr-o luna 1226 de zile - 10040 de ore, realizand o valoare de desfaceri de 1.765.370 zece mii lei. Iar fondul de salariu in aceasta luna pentru cei 60 de vanzatori a fost 174.689 mii lei.
3. Gruparea datelor inregistrate
3.1. Gruparea pe intervale de variatie egale
Gruparea pe intervale egale implica urmatoarele etape:
a) calculul amplitudinii absolute de variatie (A) care exprima imprastierea maxima a valorilor serei.
Axa = Xmax - Xmin; Axa = Ymax -Y min ;
Daca variatia este foarte mica ( in cazul nostru Axa ≤ 10) se va forma o distributie pe variante ( valabil in cazul caracteristicilor: varsta, zile lucarte).
b) stabilirea in parametrii intr-un anumit numar de grupe (r) se poate stabili astfel:
Ø Daca variatia caracteristicii este relativ uniforma si volumul de unitati nu esate suficient de mare, numarul de grupe se poate fixa anterior (se vor folosi minimul 8 grupe pentru intervale egale);
Ø Iar daca numarul grupelor nu este anterior cunoscut si volumul unitatilor este suficient de mare se recomanda stabilirea grupelor conform relatiei lui Sturgers,
r = 1+3,322log n
unde n - nr. caracteristicilor.
c) determinarea marimii intervalului de grupare (h), se calculeaza ca raport intre amplitudinea absoluta a variatiei si numarul de grupe:
h= Axa / r sau h = Xmax - Xmin / 1+3,222 log n
Nota: marimea intervalului (h) se rotunjeste la intreg in plus (ex.3,25
Prima grupa se porneste de la Xmin adaugandu-se succesiv marimea intervalului de grupare (h) rezultat din calculul anterior. Valoarea din stanga intervalului va fi considerata ca limita inferioara, iar valoarea din dreapta ca limita superioara. Valorile care formeaza limitele intervalelor se inregistreaza fie numai ca limita superioara fie ca limita inferioara pentru a evita inregistrari duble a caracteristicilor.
2A. Gruparea pe intervale egale a vanzatorilor dupa varsta
a)amplitudinea variatiei Axa = Xmax - Xmin = 27-19=8
Astfel obtinem o distributie pe variante.
Repartitia vanzatorilor dupa varsta
Repartitia vanzatorilor dupa varsta
(poligonul frecventelor)
Repartitia vanzatorilor dupa varsta
(curba cumulativa a frecventelor)
2C. Gruparea pe intervale egale a vanzatorilor dupa orele lucrate
a) Amplitudinea variatiei : Axa = Xmax - Xmin = 211-135 = 76
b) Numarul de grupe : r = 8
c) Marimea intervalului : h = Axa / r = 76 / 8 = 9.5 ≈ 10
1E. Gruparea pe intervale egale a vanzatorilor dupa salariul net lunar
a) Amplitudinea variatiei : Axa = Xmax - X min = 3692 - 2200 = 1492
b) Nr. de grupe: r= 8
c) Marimea intervalului : h = 1492/8 = 186.5
Repartitia vanzatorilor in functie de salariu net lunar (mii lei)
2.2. Gruparea vanzatorilor pe intervale neegale
Gruparea pe intervale egale ne-a permis structurarea colectivitatii pe grupe cat mai omogene. De asemenea, dupa cum s-a observat, gruparea statistica este cea mai semnificativa modalitate a sistematizarii datelor dupa o caracteristica numerica sau nominativa.
Sistematizarea datelor printr-o grupare pe intervale egale raspunde in primul rand necesitatii de sistematizare si omogenizare a datelor unei observatii statistice de masa si a caracterizarii independente a fiecarei variabile din propria observare.
Pentru analiza structurii colectivitatii pe grupe tipice se foloseste gruparea pe intervale neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
Un prim principiu al gruparii pe intervale neegale este trecerea de la variatia liniara (interval de marime constanta) la variatia neuniforma a unor intervale de grupare din ce in ce mai mari. De exemplu, de la 8 grupe se poate trece la 5 grupe. Analizand situatia concreta se pot pastra primele 3 grupe, grupa a patra se obtine cumuland-o cu grupa a cincea , iar ultimile trei grupe se pot cupla. In cazul acesta se poate trece de la grupe pe variante la grupe pe intervale.
Un alt principiu de grupare are in vedere separarea unitatilor pe trei grupe: mici, mijlocii si mari; se porneste de la intervalul mediu al caracteristicii, care se calculeaza ca o medie aritmetica simpla sau ponderata pentru fiecare variabila in parte:
sau
Unde : xi - variabila;
n - numarul unitatilor inregistrate (in cazul nostru n=60 sau daca nu avem datele initiale folosim medi seriei in care, xi sunt valorile sau centrele de interval si cu frecventele seriei) .
Algoritmul de stabilire a celor 3 grupe du intervale neegale este urmatorul:
2.2.A. Gruparea pe intervale neegale a vanzatorilor dupa varsta
Nivelul mediu
= 1366/60= 22,76 ani/vanz.
2.2.B. Gruparea pe intervale neegale a vanzatorilor dupa zilele lucrate
Nivelul mediu = 1232/60= 20,53 zile/vanz.
2.2.C. Gruparea pe intervale neegale a vanzatorilor dupa orele lucrate
Nivelul mediu = 10093/60= 168,21 ore/vanz.
2.2.D. Gruparea pe intervale neegale a vanzatorilor dupa valoarea desfacerii
Nivel mediu = 1780230/60 = 29670,5 mii lei/vanz.
2.2.E. Gruparea pe intervale neegale a vanzatorilor dupa salariu net lunar
Nivelul mediu = 175335/60 = 2922,25 zece mii lei/vanz.
2.3. Gruparea vanzatorilor dupa sex (gruparea dupa o variabila calitativa)
Structura pe sexe se determina conform relatiei:
2.4. Gruparea combinata a vanzatorilor dupa ore lucrate si salarii
Repartitia vanzatorilor dupa orele lucrate si salariu lunar
**
** |
**
******* ******
******** **
**
*** ******
*****
145 155 165 175 185 195 205 215
3. Calculul marimilor relative de structura
Din cele 5 marimi relative intalnite in statistica, in proiectul de fata se pot determina trei:
3.1. Marimile relative de structura se obtin ca raport intrte parte si intreg. Forma cea mai obisnuita de exprimare a marimilorrelative de structura este cea a procentelor care arata cate unitati din indicatorul raportat revin la 100 unitati ale indicatorului de baza raportare. Se pot calcula atat pe baza frecventelor absolute si in acest caz au sens de frecvente relative (ni
cat si pe baza valorilor centralizate privind varsta, zilele lucrate, orele lucrate, volumul desfacerilor si salariul net, obtinandu-se in acest caz ponderea sau greutatea specifica ( gi ) a unei valori ( xi ) in totalul valorilor colectivitatii ( ):
3.2. Marimile relative de coordonare se obtin ca raport intre doua grupe sau intre doua colectivitati ce coexista in spatiu.
Pentru o colectivitate impartita in doua grupe pentru care nivelul pe grupe al variabilei studiate este xA si xB :
K A/ B = xA / xB sau K B/ A = xB / xA
Daca sunt mai multe grupe, se alege una ca baza de comparatie si se raporteaza, pe rand, fiecare grupa de baza aleasa.
3.3. Marimile relative de intensitate se obtin prin raportarea a doi indicatori cu continut diferit dar intre care exista o relatie de interdependenta.
La nivel partial: Xi = Yi / Zi ;
La nivelul ansamblului:
3.A. Calculul marimilor relative pe baza repartitiei vanzatorilor dupa varsta.
Repartitia timpului lucrat (in zile si ore), a valorii desfacerii
si a fondului de salarii si a structurii acestora
In functie de varsta
Interpretare: Cei mai tineri alcatuiesc 30% din totalul angajatilor, lucreaza 29,3% respectiv 29% din totalul zilelor si orelor lucrate, realizeaza 29,9% din valoarea desfacerii si primesc 28,7% din fondul de salarii.
Repartitia timpului lucrat (in zile si ore), a valorii desfacerii
si a fondului de salarii si a raportului acestora fata de
grupa celor mai tineri, in functie de varsta
Intervalul de variatie al varstei |
Nr. vanz. ni |
Valori centralizate pentru |
Marimile relative de coordonare |
|||||||
Zile lucr. xi |
Ore lucr. yi |
Val. Desf. zi |
Fond salariu si |
Nr. vanz. ni/n1 |
Zile lucr. xi/x1 |
Ore lucr. yi/y1 |
Val. desf zi/z1 |
Fond sal. si/s1 |
||
Total |
Repartitia timpului lucrat (in zile si ore), a valorii desfacerii
si a fondului de salarii pe total si in medie pe un vanzator,
in functie de varsta salariatului
Intervalul de variatie al varstei |
Nr. vanz. ni |
Valori centralizate pentru |
Marimile relative de intensitate |
||||||
Zile lucr. xi |
Ore lucr. yi |
Val. Desf. zi |
Fond salariu si |
Zile lucr. xi/n1 |
Ore lucr. yi/n1 |
Val. desf zi/n1 |
Fond sal. si/n1 |
||
Total |
3D. Calculul marimilor relative pe baza repartitiei vanzatorilor dupa valoarea desfacerii
Repartitia timpului lucrat (in zile si ore) a fondului de salarii
si a structurii acestora in functie de valoarea desfacerii
Interval de variatie a valorii desf |
Calificativ |
Marimi relative de structura % |
|||
Frecvente relative ni |
gi |
||||
Zile lucr. |
Ore lucr. |
Fond salarii |
|||
mica | |||||
medie | |||||
mare | |||||
Total |
Repartitia timpului lucrat (in zile si ore) a fondului de salarii si a raportului acestora fata de prima grupa, in functie de valoarea desfacerii
Intervalul de variatie a valorii desf |
Nr. vanz. ni |
Valori centralizate pentru |
Marimile relative de coordonare |
|||||
Zile lucr. xi |
Ore lucr. yi |
Fond salariu si |
Nr. vanz. ni/n1 |
Zile lucr. xi/x1 |
Ore lucr. yi/y1 |
Fond sal. si/s1 |
||
Total |
Intervalul de variatie a valorii desf |
Nr. vanz. ni |
Valori centralizate pentru |
Marimile relative de intensitate |
||||
Zile lucr. xi |
Ore lucr. yi |
Fond salariu si |
Zile lucr. xi/n1 |
Ore lucr. yi/n1 |
Fond sal. si/n1 |
||
| |||||||
Total |
4. Caracterizarea statistica a repartitiilor obtinute
Caracterizarea statistica in cazul dat se refera la determinarea:
a) Indicatorilor tendintei centrale
Ø Media aritmetica
Ø Modul (modulul, dominanta)
Ø Mediana (Me)
b) Indicatorii sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
Ø Dispersia :
Ø Abaterea medie patratica
Ø Coeficientul de variatie (v):
respectiv
Ø Coeficientul de asimetrie
sau
4.A. Repartitia vanzatorilor dupa varsta
Varsta (ani) |
Nr. vanzatori |
xi ni |
Frecvente cumulate crescator |
|
|
Total |
a) Calculul indicatorilor tendintei centrale :
Ø Media aritmetica
Ø Modul (modulul, dominanta)
Fiind o serie pe variante Mo este valoarea cu frecventa maxima.
Mo= 24ani/vanz
Ø Mediana (Me)
Locul medianei: U(Me) = (60+1)/2=30,5
Variabila 23 ani este prima a carei frecventa cumulata este mai mare de 30,5.
Me=23 ani/vanz
b) Indicatorii sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
113,38/60=1,89ani/vanz
Ø Dispersia :
= 302,69/60 = 5,04
Ø Abaterea medie patratica
= 2,24 ani/vanz
Ø Coeficientul de variatie (v):
sau
v' si v <35% - seria este omogena si media este reprezentativa pentru serie
Ø Coeficientul de asimetrie
sau
Rezulta asimetrie negativa foarte moderata
4.B. Repartitia vanzatorilor dupa zilele lucrate
Zile lucrate |
Nr. vanzatori |
xi ni |
Frecvente cumulate crescator |
|
|
Total |
a) Calculul indicatorilor tendintei centrale
Ø Media aritmetica
= 1232/60 = 20,53 zile/vanz
Ø Modul (modulul, dominanta)
Fiind o serie pe variante Mo este valoarea cu frecventa maxima
Mo= 22 zile/vanz
Ø Mediana (Me)
Locul medianei: U(Me) = (60+1)/2=30,5
Variabila 21 ani este prima a carei frecventa cumulata este mai mare de 30,5.
Me=21 ani/vanz
b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
= 121,64/60 =
2,02 zile/vanz
Ø Dispersia :
= 318,89/60 = 5,31
Ø Abaterea medie patratica
= = 2,30 zile/vanz
Ø Coeficientul de variatie (v):
respectiv
v' si v <35% - seria este omogena si media este reprezentativa pentru serie
Ø Coeficientul de asimetrie
sau
Rezulta asimetrie negativa foarte moderata.
4.C. Repartitia vanzatorilor dupa orele lucrate
Zile lucrate |
Nr. vanzatori |
xi |
xi ni |
Frecvente cumulate crescator |
|
|
Total |
a) Calculul indicatorilor tendintei centrale
Ø Media aritmetica
= 10100/60 = 168,3 ore/vanz
Ø Modul (modulul, dominanta)
Locul Mo - intervalul cu frecventa maxima (175-185)
= 175+10 179,28 ore/vanz
Ø Mediana (Me)
Locul medianei: U(Me) = (60+1)/2=30,5
Deci intervalul (165-175) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.
= 165+10160,41 ore/vanz
b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
ore/vanz
Ø Dispersia :
= 21033,4/60 = 350,55
Ø Abaterea medie patratica
= 18,72 ore/vanz
Ø Coeficientul de variatie (v):
= respectiv
=
v' si v <35% - seria este omogena si media este reprezentativa pentru serie
Ø Coeficientul de asimetrie
= sau
=
Rezulta o asimetrie oblica la stanga
4.D. Repartitia vanzatorilor dupa valoarea desfacerii (zece mii lei)
Grupe de vanzatori dupa val. desf (zece mii lei) |
Nr. vanz. |
xi |
xi ni |
Frecvente cumulate crescator |
|
|
Total |
a) Calculul indicatorilor tendintei centrale
Ø Media aritmetica
= 1778950/60 = 29649,16 zece mii lei / vanz
Ø Modul (modulul, dominanta)
Locul Mo - intervalul cu frecventa maxima (30012-31990)
= 30012+1978 zece mii lei/vanz
Ø Mediana (Me)
Locul medianei: U(Me) = (60+1)/2=30,5
Prin urmare intervalul (30012-31990) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.
zece mii lei/vanz
b) Calculul indicatorilor sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
220997,36/60= 3683,28 zece
mii lei /vanz
Ø Dispersia :
= 1114817897.9/60 = 18580298,2
Ø Abaterea medie patratica
= 4310,4 zece mii lei/vanz
Ø Coeficientul de variatie (v):
= respectiv
v' si v <35% - seria este omogena si media este reprezentativa pentru serie
Ø Coeficientul de asimetrie
sau
Rezulta asimetrie negativa moderata.
4.E. Repartitia vanzatorilor dupa salariu net (mii lei)
Grupe de vanzatori dupa salariu net lunar (mii lei) |
Nr. vanz. |
xi |
xi ni |
Frecvente cumulate crescator |
|
|
Total |
a) Indicatorilor tendintei centrale
Ø Media aritmetica
= 175610/60 = 2926,83 mii lei/vanz
Ø Modul (modulul, dominanta)
Locul Mo - intervalul cu frecventa maxima (2948-3135)
= 2948+187 mii lei/vanz
Ø Mediana (Me)
Locul medianei: U(Me) = (60+1)/2=30,5
Prin urmare intervalul (2948-3135) este primul interval a carei frecventa cumulata crescator este mai mare de 30,5.
Me=2948+187 mii lei/vanz
b) Indicatorii sintetici ai variatiei si ai simetriei:
Ø Abaterea medie liniara (
18551,6/60= 309,1 mii
lei/vanz
Ø Dispersia :
= 8167801,7/60 = 136130
Ø Abaterea medie patratica
= lei/vanz
Ø Coeficientul de variatie (v):
= respectiv
Ø Coeficientul de asimetrie
= sau
=
Rezulta asimetrie negativa foarte moderata.
Indicatorii tendintei centrale, de variatie totala si de asimetrie
pentru variabilele inregistrate in esantion
Indicatorii tendintei centrale, de variatie totala si de asimetrie pentru variabilele inregistrate in esantion
Denumirea indicatorului |
Variabilele inregistrate |
|||||
Varsta |
Zile lucr. |
Ore lucr. |
Val. desf. |
Sal. net lunar |
||
Media aritmetica | ||||||
Modul | ||||||
Mediana | ||||||
Abaterea medie liniara | ||||||
Abaterea medie patratica | ||||||
Dispersia | ||||||
Coef. de variatie % dupa: |
| |||||
| ||||||
Coef. de asimetrie dupa: |
Mo | |||||
Me |
5. Aplicarea regulii de adunare a dispersiilor si verificarea gradului de semnificatie a factorului de grupare
Grupe de vanzatori dupa ore lucrate |
Subgrupe de vanzatori dupa salariul net (mii lei) |
Total |
|||||||
Total |
Mediile de grupa
mii lei /vanz
mii lei/vanz
mii lei/vanz
mii lei /vanz
mii lei/vanz
mii lei/vanz
mii lei/vanz
Media pe total (generala)
- pe baza mediilor de grupa
mii lei/vanz
c. Dispersia de grupa sau dispersia partiala
d. Media dispersiilor de grupa
e. Dispersia dintre grupe
f. Dispersia totala
sau regula de adunare a dispersiilor:
Pe baza regulii de adunare a dispersiilor se pot calcula alti doi indicatori statistici cu caracter de marimi relative de structura, care exprima ponderea celor doua categorii de factori.
Coeficientul de determinatie
Coeficientul de nedeterminatie dupa relatia
Pe baza mediilor si a abaterilor medii patratice, determinate pe grupe si pe total, se pot obtine informatii referitoare la gradul de omogenitate al acestora cu ajutorul coeficientilor de variatie corespunzatori, calculati dupa relatiile:
Coeficientul de variatie se calculeaza ca raport intre abaterea medie patratica si media variabilei respective si se exprima in procente:
unde
%
%
%
%
%
%
Coeficientul de variatie pe total
unde
Pentru interpretarea rezultatelor se vor trece indicatorii obtinuti intr-un tabel sintetic
Indicatorii tendintei centrale si de variatie
Grupe de vanzatori dupa ore lucrate |
(mii lei /vanz) |
|
(mii lei /vanz) |
|
Total |
Intrucat valoarea coeficientului de variatie este mai mica de 35%, putem aprecia ca toate cele 8 grupe de salarii nete atribuite dupa valoarea desfacerii sunt omogen. Daca ierarhizam grupele din punct de vedere a omogenitatii dintre cele mai omogene grupe sunt grupele VI si VII, iar cea mai putin omogena este III deoarece aici coeficientul de variatie este cel mai mare. Paralel cu aceasta rezulta ca media, ca indicator al tendintei centrale, este semnificativa, valorile seriei gravitand in jurul mediei grupei.
6. Estimarea limitelor pentru media colectivitatii totale si pentru nivelul totalizat al caracteristicii
Eroarea medie de reprezentativitate:
pentru selectie repetata:
pentru selectie nerepetata:
Eroarea limita maxima admisa
pentru selectie repetata
pentru selectie repetata
Intervalul de incredere al mediei colectivitatii generale:
Intervalul de incredere al nivelului totalizat al caracteristicii:
6 .1. Estimari pentru repartitia vanzatorilor dupa valoarea desfacerilor
Selectie repetata |
Selectie nerepetata |
|
Eroarea medie de reprezentativitate |
zece mii lei |
=522,55 zece mii lei |
Eroarea limita maxima admisa |
zece mii lei |
zece mii lei |
Intervalul de incredere al mediei |
zece mii lei |
zece mii lei |
Intervalul de variatie al nivelului totalizat |
zece mii lei |
zece mii lei |
Nota: Valorile necesare (media () si dispersia ()) sunt la punctul 4.D
6 .2. Estimari pentru repartitia vanzatorilor dupa salariul net lunar
Selectie repetata |
Selectie nerepetata |
|
Eroarea medie de reprezentativitate |
mii lei |
mii lei |
Eroarea limita maxima admisa |
mii lei |
mii lei |
Intervalul de incredere al mediei |
mii lei |
mii lei |
Intervalul de variatie al nivelului totalizat |
mii lei |
mii lei |
Nota: Valorile necesare (media () si dispersia ()) sunt la punctul 4.E
7. Analiza corelatiei dintre valoarea desfacerii si salariu
Corelatia liniara simpla (date negrupate)
Se aplica pentru primele 10 unitati din esantion, privind numarul de ore lucrate (xi) si salariul net lunar (yi ) - mii lei. Seria se va ordona crescator dupa numarul de ore lucrate (xi) mentinandu-se salariul net lunar (yi ) corespunzator.
Dintre metodele simple de cercetare a legaturilor statistice recurgem la :
a) Metoda seriilor paralele interdependente
Nr. crt |
Ore lucrate (xi) |
Salariul net lunar (mii lei) (yi) |
Concluzie: Valorile xi fiind ordonate crescator se poate observa ca si valorile yi cresc in cea mai mare parte, ceea ce sugereaza o legatura directa.
b) Metoda grafica este o alta cale de a stabili legatura dintre fenomene
Pentru a obtine graficul de corelatie, denumit si corelograma, valorile caracteristicii factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observata a celor doua caracteristici se reprezinta grafic printr-un punct.
Graficul de asemenea confirma o legatura directa de forma liniara.
Metoda grafica este utilizata cu bune rezultate pentru alegerea functiei analitice care se studiaza (in cazul regresiei si corelatiei)
Metodele de studiere a legaturilor prezentate anterior au ca deficienta principala faptul ca desi permit constatarea legaturii si caracterulul ei, nu o pot masura printr-un indicator sintetic. Acest inconvenient este inlaturat prin utilizarea metodei regresie.
Metoda regresiei constituie o metoda statistica analitica de cercetare a legaturii dintre variabile cu ajutorul unor functii denumite functii de regresie.
Notand cu Y variabile dependenta si cu x1 , x2 xn variabilele independente obtinem ecuatia de regresie y = f (x1 , x2 xn).
In cazul de fata am apelat la modelul de regresie unifactoriala liniar considerand legatura dintre y si x de tipul yxi = a +bxi. Parametri ecuatiei in acest caz se determina prin rezolvarea urmatorului sistem de ecuatii:
Daca se foloseste metoda determinantilor se obtine:
Datele necesare calcularii celor doi parametri sunt prezentate in tabelul de mai jos.
Nr ctr. |
xi |
yi |
|
xiyi |
Yxi=-259,98+18,88xi |
Total |
Functia de regresie este: Yxi=-259,98+18,88xi
a) Raportul de corelatie liniara simpla se calculeaza cu formula:
Nr. crt |
xi |
yi |
Yxi |
(yi - Yxi)2 |
(yi - )2 |
|
Unde: 29532/10=2953,2 mii lei/vanz
b) Metoda coeficientului de corelatie
Intensitatea legaturii se masoara prin coeficientul de corelatie (ry/x).
Rezulta ca legatura dintre aceste doua variabile este directa (rz/x>0) si puternica. Exista legatura liniara intensa deoarece ry/x=Ry/x.
c) Calculul coeficientului de corelatie a rangurilor
Coeficienul de corelatie a rangurilor propus de Spearman:
in care: di - reprezinta diferenta intre rangurile perechii de valori (xi,yi);
n - numarul de perechi de valori.
Coeficientul de corelatie a rangurilor propus de Kendall :
in care
in care: Pi - numarul rangurilor mai mari care urmeaza rangului curent pentru variabila dependenta;
Qi - numarul rangurilor mai mici care urmeaza rangului curent pentru variabila dependenta.
Coeficienul de corelatie a rangurilor propus de Spearman:
Coeficientul de corelatie a rangurilor propus de Kendall :
Calculul coeficientilor de corelatie a rangurilor
Nr crt |
xi |
yi |
Ranguri |
di=rxi-ryi |
di2 |
Pi |
Qi |
Pi-Qi |
|
rxi |
ryi |
||||||||
total |
ANEXA
Identificarea legii de repartitie
(verificarea ipotezelor statistice)
Pe baza acestor caracteristicilor (determinate empiric, ale) variabilei aleatoare , respectiv pe baza indicatorilor empirici, se formuleaza ipoteze privind tipul legii de repartitie a variabilei aleatoare si valorile parametrilor asociati legii respective. Verificarea (sau validarea) acestor ipoteze se concretizeaza in identificarea legii de repartitie (distributie) asociate lui .
Verificarea ipotezelor statistice consta in compararea distributiei empirice (numerice) - de natura/tipologie necunoscuta - cu o alta distributie, empirica (numerica) sau analitica, dar de natura/tipologie cunoscuta, potrivit unor teste numerice statistice. In conditiile invalidarii testelor respective, se infirma identitatea naturii/tipologiei celor doua distributii comparate. Daca insa testele sunt verificate/validate, se accepta faptul ca cele doua distributii pot avea aceeasi natura (respectiv pot fi de acelasi tip).
Se considera, asadar, doua esantioane/selectii distincte, , , si respectiv, , , unde si sunt volumele celor doua esantioane/selectii. Prelucrarile statistice preliminare au fost efectuate pe acelasi domeniu de definitie , utilizand aceeasi diviziune a acestuia (pentru ambele selectii) . Au rezultat, la nivelul fiecarui subinterval , , si valori experimentale (defectari/cedari) observate, corespunzatoare celor doua selectii investigate.
In urma prelucrarilor statistice preliminare, au fost determinate densitatile de probabilitate empirice si , functiile de repartitie empirice si , valorile medii empirice si , dispersiile empirice corectate si , respectiv abaterile patratice medii empirice corectate si , aferente celor doua selectii/esantioane.
Se urmareste identificarea legii (legilor) de repartitie aferente celor doua selectii si determinarea valorilor parametrilor asociati legii (legilor) respective, prin intermediul metodelor corespunzatoare verificarii ipotezelor statistice. Potrivit acestora, se admite egalitatea caracteristicilor de tip valoare numerica (medie sau dispersie) sau, dupa caz, identitatea legilor de repartitie (respectiv identitatea densitatii de probabilitate sau a functiei de repartitie) aferente celor doua esantioane/selectii studiate. In urma evaluarii unui parametru statistic specific, se determina probabilitatea ca ipoteza egalitatii/identitatii sa fie adevarata. Daca valoarea acestei probabilitati este mica (ex. 0,01 , maximum 0,05), se poate afirma ca ipoteza statistica - a egalitatii caracteristicilor de tip valoare numerica sau a identitatii legilor de repartitie - este falsa. O valoare ridicata a probabilitatii respective (ex. 0,80) nu inseamna neaparat ca ipoteza admisa este adevarata.
Ipoteza identitatii legilor de repartitie poate fi utilizata si in circumstantele compararii unei distributii empirice (obtinuta prin prelucrarea statistica a unui esantion) cu o lege de repartitie teoretica data (etalon).
1. Testul t (Student) pentru confirmarea diferentei dintre
valorile medii caracteristice
1.1. Cazul in care se admite egalitatea dispersiilor
Metodologia care trebuie urmata este:
a) Se calculeaza eroarea standard a diferentei mediilor:
;
b) se calculeaza parametrul statistic t:
;
c) se stabileste numarul total al gradelor de libertate:
n n1 n2
d) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi valoare medie a variabilei aleatoare:
in care:
reprezinta functia de probabilitate corespunzatoare distributiei Student, iar
este functia Beta de argumente a si b .
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01 , maximum 0,05), se poate afirma ca valorile medii ale celor doua esantioane difera semnificativ.
1.2. Cazul in care se considera ca dispersiile esantioanelor difera semnificativ
Metodologia care trebuie urmata este:
a) se calculeaza parametrul statistic t:
;
b) se evalueaza numarul echivalent (fractionar) total al gradelor de libertate:
;
c) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi valoare medie a variabilei aleatoare, utilizand aceleasi formule .
2. Testul F pentru confirmarea diferentei dintre
dispersiile caracteristice
Metodologia care trebuie urmata este:
a) se determina parametrul statistic (supraunitar) F si numerele gradelor de libertate caracteristice:
, daca
si respectiv,
, daca ;
b) se evalueaza probabilitatea ca cele doua selectii sa fie caracterizate prin aceeasi dispersie a variabilei aleatoare:
in care
este functia Beta incompleta de parametru si argumente a, respectiv b.
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca dispersiile celor doua esantioane difera semnificativ.
3. Compararea distributiilor pentru doua esantioane distincte
3.1. Testul pentru confirmarea diferentei dintre cele doua distributii
Metodologia care trebuie urmata este:
a) se calculeaza parametrul statistic
;
b) se stabileste numarul gradelor de libertate:
, daca ,
respectiv
, daca ;
c) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:
,
in care:
reprezinta complementara functiei Gamma incomplete de argument a si parametru , iar
este functia Gamma de argument a.
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributiile aferente celor doua esantioane difera semnificativ.
3.2. Testul Kolmogorov - Smirnov (K-S) pentru confirmarea diferentei dintre cele doua distributii
Metodologia care trebuie urmata este:
a) se determina valoarea maxima a diferentei absolute dintre functiile de repartitie empirice aferente celor doua esantioane:
;
b) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:
in care
reprezinta functia Kolmogorov - Smirnov (K-S) de argument l
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributiile aferente celor doua esantioane difera semnificativ.
4. Compararea unei distributii empirice cu o lege
de repartitie teoretica (etalon)
Se considera o lege teoretica - si cunoscuta - de repartitie a variabilei aleatoare , definita prin functia de repartitie , si prin densitatea de probabilitate , . Se compara distributia empirica aferenta primului esantion investigat (esantionul nr. 1) cu distributia etalon considerata.
4.1. Testul pentru confirmarea diferentei dintre cele doua distributii
Metodologia care trebuie urmata este:
a) se evalueaza, pentru fiecare subinterval de discretizare , , numarul teoretic (de obicei fractionar) de valori numerice observabile (respectiv de cedari/defectari), potrivit legii de repartitie teoretice (etalon) considerate:
, ;
b) se calculeaza parametrul statistic
;
c) se stabileste numarul gradelor de libertate:
;
d) se evalueaza probabilitatea ca legea de repartitie teoretica (etalon) sa corespunda esantionului nr.1 investigat, utilizand aceleasi formule .
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributia aferenta esantionului nr. 1 difera semnificativ de repartitia teoretica considerata.
4.2. Testul Kolmogorov - Smirnov (K-S) pentru confirmarea
diferentei dintre cele doua distributii
Metodologia care trebuie urmata este:
a) se determina valoarea maxima a diferentei absolute dintre functia de repartitie empirica (esantionul nr.1) si functia de repartitie teoretica considerata:
b) se evalueaza probabilitatea ca cele doua esantioane/selectii sa fie caracterizate prin aceeasi lege de repartitie a variabilei aleatoare:
functia Kolmogorov - Smirnov (K-S) fiind explicitata prin intermediul aceleiasi formule .
Daca rezulta o valoare mica a probabilitatii P (ex. 0,01, maximum 0,05), se poate afirma ca distributia aferenta esantionului nr. 1 difera semnificativ de repartitia teoretica considerata.
BIBLIOGRAFIE
1. Elena-Maria Biji, Eugenia Lilea, Mihaela Vatui, Emilia Gogu, STATISTICA APLICATA IN ECONOMIE, Editura Oscar Print, 2001
2. . Elena-Maria Biji, Eugenia Lilea, Mihaela Vatui, Emilia Gogu, APLICATII STATISTICE IN STUDIUL FENOMENELOR ECONOMICE, Editura Oscar Print, Bucuresti 2003
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 1682
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved