Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
Statistica


Sistematizarea datelor prin centralizare si grupare

Statistica



+ Font mai mare | - Font mai mic



Sistematizarea datelor prin centralizare si grupare

Datele primare obtinute in urma observarii statistice , indiferent de tipul lor , prezinta o mare varietate , necesitand sistematizarea acestora pentru a putea oferi claritatea necesara si adaptabilitatea pentru calcule .



Prin sistematizarea datelor se intelege organizarea colectivitatii studiate din punct de vedere al unitatilor componente si al caracteristicilor inregistrate. Sistematizarea are rolul de a facilita compararea , corelarea logica a doua sau mai multe caracteristici.

Realizata manual sau cu ajutorul calculatorului electronic, in general, sistematizarea primara a datelor este matriciala.

De exemplu : daca se alege o colectivitate , notata cu U , alcatuita din n unitati statistice, notate cu u1,u2,..,ui, ., un si se aleg m caracteristici , notate xj, aceste elemente pot fi descrise astfel:

____

U= i=1,n

___

X= j=1,m

Dupa inregistrarea valorilor si variantelor caracteristicilor pentru toate unitatile statistice se obtine o matrice de ordinul n*m, adica Xnm=[xij] , unde xij reprezinta valoarea caracteristicii j pentru unitatea statistica i.

Forma generala a matricii este prezentata in tabelul nr.2.1.:

Tabel 2.1.

Unitatile colectivitatii

uI

Caracteristicile observate (xj)

x1 x2 . . . xj . . . xm

u1

u2

.

.

.

ui

.

.

.

un

x11 x12 . . . x1j . . . x1m

x21 x22 . . . x2j ... x 2m

xi1 xi2 . . . xij . . . xim

xn1 xn2 . . . xnj . . . xnm

Marimea matricii depinde de numarul caracteristicilor alese si de numarul unitatilor supuse observarii.Elementele matricei pot fi nule, pozitive sau negative. Pe baza maticei, pentu necesitatile diferitelor analize, se pot alcatui:

- vectorul linie "i", format din totalitatea caracteristicilor inregistrate la nivelul unei unitati statistice a colectivitatii;

-vectorul coloana "j", format din totalitatea valorilor unei caracteristici la toate unitatile statistice.

Pe baza datelor primare, din caracteristicile numerice se pot calcula caracteristici derivate prin:

a) operatii de adunare-scadere, pentru datele exprimate in aceeasi unitate de masura;

b) operatii de multiplicare (de inmultire) si de raport (impartire) pentru datele exprimate in unitati de masura diferite.

scale de masurare prin atribuirea de valori fiecarei caracteristici.

Se pot folosi patru scale de masurare:

scala nominala;

scala ordinala;

scala de interval;

scala de raport.

Scala nominala consta in atribuirea de variante caracteristicilor nenumerice, astfel incat toti indivizii apartinand aceleiasi clase sa aiba aceeasi valoare atribuita.

De exemplu, pentru caracteristica "domiciliu", studentii vor forma doua grupe. Prima grupa cuprinde studentii din mediul urban, care se poate codifica drept clasa 1 si o grupa care cuprinde studentii din mediul rural, notata drept clasa 2.

Volumul de informatii obtinut prin sistematizarea datelor cu ajutorul scalei nominale este direct proportional cu numarul claselor construite; asadar cu cat numarul claselor creste, cu atat analiza este mai amanuntita.

Scala ordinala se aplica tot in cazul caracteristicilor nenumerice calitative, unitatile statistice putand fi ordonate crescator sau descrescator si li se pot atribui ranguri sau numere de ordin.

De exemplu: ordonarea gimnastilor dupa numarul de medalii obtinute:

nici o medalie;

o medalie;

doua medalii;

trei sau mai multe medalii.

Scala de interval se utilizeaza pentru caracteristicile atributive cantitative si presupine introducerea intre valorile caracteristicii a distantei dintre ele. Aplicarea acestei scale consta in atribuirea de valori caracteristicii masurate in functie de intervalul dintre valori. In acest caz, punctul zero al scalei si unitatea de masura se pot alege arbitrar sau conventional. Scala de interval se aplica la cuantificarea curgerii timpului calendaristic sau la masurarea temperaturii.

Scala de raport (metrica) este cea mai inalta treapta de masurare, cu ajutorul acesteia se exprima cele mai multe caracteristici numerice economice. In cazul acestei scale, punctul zero este dat in mod natural, semnificand efectiv absenta fenomenului.

Valorile masurate pe scala de raport pot fi: cantitatile executate, vandute, venituri realizate, preturi unitare, varsta, vechimea mica.

Sistematizarea datelor se efectueaza prin centralizare si grupare.

Centralizarea datelor consta in strangerea datelor la locul prelucrarii a tuturor informatiilor si determinarea totalurilor pentru caracteristicile direct insumabile sau care devin insumabile, prin aplicarea unor coeficienti de echivalenta.

Centralizarea datelor poate fi: - simpla;

- pe grupe.

Centralizarea simpla inseamna agregarea valorilor individuale ale caracteristicilor pentru toate unitatile de colectivitati care permit insumarea din punct de vedere al continutului, in scopul obtinerii indicatorilor totalizatori. In urma centralizarii simple se obtin informatii privind volumul colectivitatii si valoarea totalizata a caracteristicilor cuprinse in planul observarii si care sunt exprimate in unitati de masura insumabile.

Centralizarea pe grupe are drept scop cunoasterea mai detaliata a fenomenului, permitand analiza structurii colectivitatii. Aceasta consta in gruparea datelor si in calcularea indicatorilor totalizatori pe fiecare grupa, iar pe baza lor a indicatorilor totalizatori pe intreaga colectivitate. Centralizarea pe grupe include mai multe centralizari simple.

In urma centralizarii se obtin indicatori statistici totalizatori ce au un continut concret si o forma specifica de exprimare, motiv pentru care sunt denumiti indicatori absoluti. Ei constituie baza informationala a cunoasterii statistice si sunt urmariti statistic la toate structurile organizatorice ale economiei nationale.

Gruparea statistica (clasificare, stratificare) consta in impartirea colectivitatilor statistice in grupe omogene de unitati statistice, dupa variatia uneia sau mai multor caracteristici de grupare.

La aplicarea gruparilor se opereaza cu notiunile urmatoare:

caracteristica de grupare;

variatia;

amplitudinea;

grupa omogena.

Caracteristica de grupare este acea insusire in functie de care unitatile statistice se separa pe clase sau pe grupe omogene.

Variatia este proprietatea caracteristicilor de grupare, de a inregistra mai multe valori sau mai multe forme de manifestare.

Amplitudinea,notata cu A, reprezinta campul de variatie a tuturor valorilor individuale ale unei caracteristici si se determina ca diferenta intre valoarea maxima si minima.

Grupa omogena reprezinta clasa de unitati statistice la care variatia caracteristicii de grupare este minima.

Gruparile statistice se pot clasifica dupa mai multe criterii.

1.In functie de numarul caracteristicilor de grupare, gruparile statistice pot fi:

a. simple;

b. combinate.

a. Gruparile simple se efectueaza dupa o singura caracteristica de grupare si sunt utile pentru determinarea tendintei de concentrare a fenomenelor.

Forma generala a unei grupari simple este prezentata in in tabelul simplu nr.2.2:

Forma generala a unei grupari simple

Tabel 2.2.

Caracteristica

xi

Numar de unitati statistice

fi

x1

x2

.

.

xi

.

.

xn

f1

f2

.

.

fi

.

.

fn

TOTAL

åfi

b. Gruparile combinate se obtin dupa doua sau mai multe caracteristici. In acest caz, colectivitatea se imparte in grupe omogene dupa o anumita caracteristica, apoi aceste grupe se impart, la randul lor, in alte subgrupe mai mici, dupa o alta caracteristica.

Gruparea combinata dupa mai mult de doua caracteristici este relativ rara, deoarece odata cu cresterea numarului de caracteristici, scade claritatea, exigibilitatea unui astfel de tabel.

Tabelele obtinute dupa o grupare combinata se numesc tabele cu dubla intrare (vezi tabelul nr.2.3.). Tabel 2.3.

Caracteristica

Caracte- yj

-ristica

xi

y1 y2 . . . yj . . . ym

Total dupa caracteristica x

x1

x2

.

xi

.

.

xn

f11 f12 . . . . f1j . . . f1m

f21 f22 . . . f2j . . . f2m

. . . .

. . . .

fi1 fi2 . . . fij . . . fim

. . . .

fn1 fn2 . . . fnj . . . fnm

fx1

fx2

.

.

fxi

.

.

fxn

Total dupa caracteristica y

fy1 fy2 . . . fyj . . . fym

SSfij

Intre frecventele totalizate pe randuri si coloane exista urmatoarele relatii:


2.In functie de continutul caracteristicilor de grupare, exista urmatoarele categorii de grupari:

a)      grupari teritoriale: in cazul in care impartirea in grupe omogene se face dupa apartenenta teritoriala a unitatii.

b)      grupari cronologice: cand timpul este considerat elementul definitoriu in sistematizarea datelor.

c)      grupari tipologice: in functie de o caracteristica atributiva calitativa.

d)      grupari cantitative (numerice): dupa o caracteristica atributiva cantitativa.

In functie de gradul de variatie, gruparile cantitative pot fi:

- pe variante, in cazul in care numarul variantelor valorilor numerice inregistrate este redus, iar fiecarei valori ii corespunde o grupa.

- pe intervale, in cazul in care variatia caracteristicii este mare. Intervalele de grupare pot fi egale sau neegale.

Gruparea numerica pe intervale egale se realizeaza parcurgand mai multe etape:

Se calculeaza amplitudinea (A), ca diferenta intre valarea maxima (xmax) si valoarea minima (xmin) a caracteristicii de grupare:

A=xmax-xmin

Se determina numarul de grupe in care se va imparti colectivitatea dupa relatia lui H. D. Sturges:

ng=1+3.322lgn

unde : ng- numarul de grupe

n - numarul de unitati statistice din care este alcatuita colectivitatea.

se determina marimea intervalelor de grupare (h), dupa formula :


4. se construiesc intervalele de grupare prin adunarea succesiva a marimii intervalelor de grupare pornind de la valoarea minima a caracteristicii de grupare (xinf), care devine limita inferioara a primului interval de grupare.

In vederea obtinerii unei grupari corecte trebuie respectate cateva reguli , cum ar fi:

- limita inferioara a primului interval se poate stabili mai mica decat xinf;

marimea intervalului de grupare (k) trebuie sa fie un numar intreg, daca este numar zecimal intotdeauna se rotunjeste in sus;

- limita superioara a unui interval poate fi egala sau neegala cu limita inferioara a intervalului imediat urmator.

Forma unui tabel care prezinta o grupare pe intervale este urmatoarea:

Tabel 2.4.

Intervale de grupare dupa caracteristica xi

Numar de unitati statistice fi

x1inf-x1sup

x2inf-x2sup

xIinf-xIsup

xminf-xmsup

f1

f2

fi

. . .

fm

Total

åfi



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 2849
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved