CATEGORII DOCUMENTE |
Astronomie | Biofizica | Biologie | Botanica | Carti | Chimie | Copii |
Educatie civica | Fabule ghicitori | Fizica | Gramatica | Joc | Literatura romana | Logica |
Matematica | Poezii | Psihologie psihiatrie | Sociologie |
Caracterizarea repartitiilor de frecventa
Datele (care se refera la diferite domenii ale cunoasterii) odata aranjate intr-o repartitie de frecvente, scot in evidenta trasaturile commune ale tuturor curbelor de repartitie si care se supun unor legi generale. Acest lucru ne permite ca experienta castigata intr-un anumit domeniu al cunoasterii sa poata fi extinsa si in alt domeniu.
La toate curbele insa trebuie sa observam variabilitatea marimilor care se obtin ca rezultat al unor masuratori. Cu toate ca exista variabilitate, se observa o tendinta a datelor de a se grupa in centrul curbei (tendinta centrala). Daca se masoara marimea abaterii de la punctul de concentrare maxima a frecventelor, se constata ca sunt mai frecvente abaterile mici decat cele mari, ca abaterile in ambele parti fata de punctul de concentrare maxima se echilibreaza aproape complet si ca abaterile foarte mari sunt foarte rare. Deoarece frecventa variaza, vom alege acea marime care se intalneste cel mai des. Ea va fi masura tendintei centrale a repartitiei. Aceasta marime, ca si altele asemanatoare se numesc indicatori (sau parametrii) de pozitie, deoarece arata pozitia elementelor principale ale repartitiei pe axa absciselor.
Caracterul reprezentativ al oricarui indicator de pozitie depinde de cat de strins i se alatura celelalte valori, sau cu alte cuvinte, de gradul de concentrare a datelor in jurul tendintei centrale.
Indicatorii tendintei centrale
Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o populatie statistica se face prin calcularea unor medii, in felul acesta facandu-se o compensare a valorilor individuale. Acest calcul ne arata o anumita tendinta a fenomenului studiat, media statistica fiind o valoare ce sintetizeaza intr-o singura expresie numerica toate valorile din seria masuratori sau observatii. Termenii seriei difera de medie deoarece au fost influentati de diferiti factori.
Media aritmetica
Media aritmetica simpla exprima un nivel mediu, anihiland abaterile individuale, netipice. Ea este cuprinsa intre valoraea cea mai mare si cea mai mica.
Definitia 1. Daca in urma unei selectii apar valorile distincte x1, x2,, xn, atunci media aritmetica este data de formula:
In cazul datelor centralizate (in care avem repartitia de frecventa (2)):
care se mai numeste medie aritmetica ponderata. Numarul care arata de cate ori se repeta fiecare valoare (nj) este 'ponderea' valorii respective.
Observatia 1. Media aritmetica are dezavantajul ca este sensibila la valori extreme, iar daca termenii sunt prea 'imprastiati', tinde sa devina o valoare nereprezentativa. Media aritmetica este o valoare lipsita de continut daca elementele sunt deosebite din punct de vedere calitativ, caz in care este mai util sa se faca medii partiale pentru fiecare tip de colectivitate.
Observatia 2. Daca avem mai multe medii, fiecare referindu-se la o anumita categorie, fiecare medie va fi ponderata in functie de importanta categoriei sale.
Media geometrica
Media geometrica este mai putin sensibila la valorile extreme decat celelalte medii, deci se intrebuinteaza cand dorim sa atenuam divergentele mari dintr-o serie de determinari cu frecvente egale, fiind dupa o expresie 'cea mai exacta medie'. Se utilizeaza cand valorile au o evolutie (de crestere sau scadere) permanenta, neintrerupta, sau o ratie din ce in ce mai mare, termenii fiind legati intre ei printr-o relatie de produs. De asemenea se mai intrebuinteaza cand vrem sa dam o importanta mai mare termenilor mai mici, in valoare absoluta, sau cand diferentele intre termeni sunt foarte mari. Are dezavantajul ca nu se poate intrebuinta cand avem valori nule sau negative.
Definitia 2 Daca x , x2,, xn sunt n valori, media geometrica se defineste prin
Calculul se face mai usor cu ajutorul logaritmilor:
Datorita faptului ca se calculeaza mai usor cu ajutorul logarimilor, se mai numeste 'medie logaritmica'. Ea se utilizeaza si la calcularea ritmului (de crestere sau descrestere) numindu-se astfel si 'medie de ritm'. In rezumat, se intrebuinteaza cand:
- seria are o mare dinamicitate;
- termenii au variatii mari;
- distributia are un caracter pronuntat de asimetrie.
Observatia 3 Media geometrica se foloseste atunci cand prezinta importanta variatiile relative. De asemenea media geometrica poate fi folositoare pentru calculul unor rapoarte.
Media patratica se intrebuinteaza cand valorile prezinta cresteri din ce in ce mai mari. Ea constituie modelul matematic pentru abaterea medie patratica. Media este sensibila la valori extreme, din care cauza este intotdeauna mai mare decat celelalte medii. Are avantajul ca se poate aplica si in cazul valorilor nule sau negative (care prin ridicare la patrat devin pozitive). Se intrebuinzeaza cand dam importanta valorilor mari.
Definitia 3 Media patratica este definita prin formula:
sau in cazul datelor centralizate (media ponerata):
Definitia 4 Media armonica este valoarea inversa a mediei aritmetice ale valorilor inverse datelor de observatie:
Exprima caracterul sintetic al unor valori ce se afla in raport invers. Se utilizeaza cand frecventele sunt egale. Pentru o repartitie de frecventa, media armonica se foloseste rar. Se utilizeaza cu predilectie in economie.
Media glisanta numita si 'medie mobila', se utilizeaza in cazul in care sirul valorilor prezinta fluctuatii mari, bruste si e greu de apreciat tendinta (trendul). Se presupune ca media glisanta corespunde mijlocului intervalului sintetic. Calculul se face mediind 3 sau 5 valori alaturate.
Definitia 5. Media glisanta pentru 3, respectiv 5 valori alaturate sunt date de formulele
Definitia 6. Mediana este elementul dintr-un sir de date statistice care ar imparti intervalul in doua grupe egale ca numar, dupa ce acestea au fost ordonate dupa marimea lor. Daca seria are 2n+1 elemente, atunci mediana este elementul n+1, iar daca are 2n elemente mediana este media aritmetica a celor doi termini din mijloc.
O medie este reprezentativa numai atunci cand se calculeaza din valori omogene intre ele. Cu cat fenomenele sunt mai complexe (dependente de mai multi factori), cu atat variatia este mai mare si utilizarea marimilor medii devine insuficienta. De aceea este important de cunoscut cat de 'departe' sunt valorile sumei statistice fata de medie. Comparatia se face cu media seriei, considerata ca fiind valoarea cea mai reprezentativa pentru populatia statistica.
Analiza statistica a unei repartitii poate fi aprofundata prin calculul indicatorilor de variatie. Acesti indicatori trebuie sa serveasca la :
verificarea reprezentativitatii mediei ca valoare tipica a unei populatii statisatice;
verificarea gradului de omogenitate a seriei;
caracterizarea statistica a formei si gradului de variatie a unui indicator;
cunoasterea gradului de influenta a factorilor dupa care s-a facut gruparea unitatilor observate.
Indicatorii simpli ai variatiei.
Indicatorii simpli ai variatiei servesc la caracterizarea gradului de imprastiere a marimilor seriei statistice. Se pot exprima atat in marimi absolute cat si in marimi relative.
Din aceasta grupa fac parte :
amplitudinea variatiei (absoluta si relativa);
abaterile individuale (absolute si relative).
Amplitudinea absoluta se calculeaza ca diferenta dintre valoarea maxima si valoarea minima al caracteristicii :
Aa = xmax - xmin
Amplitudinea relativa se exprima de regula in procente si se calculeaza ca un raport intre amplitudinea absoluta si media aritmetica :
Ar=
Abaterile individuale absolute (di) se calculeaza ca diferenta intre fiecare valoare si media aritmetica :
di = xi - , i = 1,,n
Abaterile individuale relative (dr) se calculeaza ca raportul dintre abaterile individuale absolute si media aritmetica (se exprima in procente) :
dr , i = 1,,n
Gradul de variatie al unei caracteristici depinde de toate abaterile variantelor inregistrate si de frecventa lor de aparitie si prin urmare indicatorii simpli ai variatiei nu pot exprima intreaga variatie a unei populatii statistice. De aceea a fost necesara introducerea indicatorilor sintetici ai variatiei.
Indicatorii sintetici ai variatiei.
Indicatorii sintetici ai variatiei, la fel ca si indicatorii tendintei centrale trebuie sa se bazeze pe toate observatiile, sa fie usor de calculat, usor de inteles si sa fie cat mai putin afectati de fluctuatiile de selectie.
Indicatorii sintetici ai variatiei sunt :
abaterea medie liniara ;
abaterea medie patratica;
dispersia;
coeficientul de variatie.
Abaterea medie liniara se calculeaza ca o medie aritmetica simpla sau ponderata, luate in valoare absoluta :
Pentru o serie simpla
Abaterea medie liniara prezinta dezavantajul ca nu tine seama de faptul ca abaterile mai mari in valoare absoluta influenteaza in mai mare masura gradul de variatie a unei caracteristici, in comparatie cu abaterile mici. In plus, nu este indicat sa se renunte in mod arbitrar la semnul valorilor din care se calculeaza o valoare medie. Din aceste considerente se foloseste ca principal indicator sintetic al variatiei abaterea medie patratica.
Abaterea medie patratica sau abaterea standard (σ) se calculeaza ca o medie patratica din abaterile tuturor elementelor seriei de la media lor aritmetica:
Acest indicator este mai concludent decat abaterea medie liniara. Prin ridicarea la patrat se da o importanta mai mare abaterilor mari in valoare absoluta, acestea influentand intr-o masura mai mare gradul de variatie al variabilelor analizate.
In literatura de specialitate se apreciaza ca pentru o serie de distributie normala abaterea medie liniara este egala cu 4/5 din valoarea abaterii medii patratice.
Abaterea medie patratica este un indicator de baza, care se foloseste la analiza variatiei, la estimarea erorilor de selectie in calculul de corelatie.
La fel ca abaterea medie liniara, abaterea medie patratica se exprima in unitatea de masura a variabilei a carei variatie o caracterizeaza. Prin urmare cei doi indicatori nu se pot folosi pentru compararea gradului de variatie si in aceasta situatie se recurge la un alt indicator de variatie : coeficientul de variatie.
Coeficientul de variatie (v) se calculeaza ca un raport intre abaterea medie patratica si media aritmetica. De obicei se exprima sub forma de procente :
v =
Semnificatie. Cu cat valoarea lui v este mai aproape de zero cu atat variatia este mai slaba, colectivitatea este mai omogena, media avand un grad ridicat de reprezentativitate. Cu cat valoarea lui v este mai mare cu atat variatia este mai intensa, colectivitatea este mai eterogena, iar media are un nivel de semnificatie scazut.
Se apreciaza ca la un coeficient de peste 35-40%, media nu mai este reprezentativa si datele trebuie separate in serii de componente, pe grupe, in functie de variatia unei alte caracteristici de grupare.
Se poate afirma ca acest indicator poate fi folosit ca un test in aplicarea metodei gruparii. Daca media aritmetica este aproape de zero, coeficientul de variatie nu are semnificatie.
Dispersia ) este media patratelor abaterilor de la media aritmetica :
Masura dispersiei se refera la imprastierea valorilor dintr-un set de date. Media nu are semnificatie daca se aplica pe un set de date foarte dispersate. De exemplu daca luam valoarea medie a oraselor mari (peste 200.000 locuitori) va da o valoare de peste 400.000 datorita Bucurestiului care are 2.000.000. Insa rezultatul nu are nici o semnificatie (nici un oras nu area aceasta valoare).
Masurile dispersiei, exprimate sub forma unitatilor de masura ale fenomenului cercetat, nu sunt intotdeauna utile atunci cand se compara dispersiile a doua sau mai multe serii. Compararea dispersiilor a doua sau mai multe serii da rezultate in urmatoarele 2 situatii:
a) sirurile care se compara pot fi exprimate in aceleasi unitati, iar mediile pot fi aceleasi sau au dimensiuni aproape egale.
b) sirurile care se compara pot fi exprimate in aceleasi unitati, insa mediile difera.
Daca seriile se exprima in unitati diferite, dispersiile nu pot fi comparate direct. De aceea de multe ori se foloseste abaterea medie patratica in loc de dispersie.
In unele lucrari aceasta marime se numeste varianta (din l. engl. variance). Varianta este o masura importanta in special cand se studiaza variatia a doua sau mai multe esantioane. O tehnica statistica foarte puternica este cunoscuta sub numele de analiza de varianta si utilizeaza dispersia pentru a decide daca un numar de esantioane difera semnificativ unul de altul.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 1368
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2025 . All rights reserved