Scrigroup - Documente si articole

     

HomeDocumenteUploadResurseAlte limbi doc
Statistica


Statistica descriptiva

Statistica



+ Font mai mare | - Font mai mic



Statistica descriptiva

Problema Se face un studiu pe un lot format din 20 de pacienti la care se urmaresc parametrii biomedicali: tensiunea arteriala diastolica (TAD) (mmHg), tensiunea arteriala sistolica (TAS) (mmHg), varsta (zile), talia(cm), greutate(grame), scor Apgar, Varsta gestationala(saptamani), Sex. Datele sunt prezentate in tabelul de mai jos:



TAS (mmHg)

TAD (mmHg)

Varsta (zile)

Talia (cm)

Greutate (grame)

Scor Apgar

Varsta gestationala (saptamani)

Sex(M/F)

180

80

43

55

5500

10

40

M

170

70

67

52

4100

9

39

M

175

100

28

56

3700

8

38

F

120

50

49

53

5200

10

41

M

110

65

21

61

4200

9

41

M

140

70

54

50

2800

6

30

F

110

85

72

55

4300

9

36

M

130

95

80

60

4200

9

35

F

140

105

43

51

4900

10

38

F

135

50

51

56

4400

9

37

F

120

55

21

52

5400

10

39

F

100

60

35

55

5600

10

39

M

140

90

34

54

5100

9

36

M

130

75

56

56

5200

10

38

F

160

80

78

59

4000

8

37

M

170

90

45

56

3800

9

39

F

165

85

32

52

4500

10

40

F

150

65

54

49

4200

7

37

M

155

70

76

55

4900

9

38

F

Cerinte

  1. Copiati tabelul pe Sheet1.
  2. Realizati in Sheet2 (pe care il denumiti Tipuri variabile) tabelul de mai jos. In coloana a doua completati tipul variabilei    (calitative nominale (neordonabile), calitative nominale ordonabile, calitative dichotomiale, cantitative continue, cantitative discrete finite, cantitative discrete infinite), iar in coloana a treia completati scalele de masura (nominala, ordinala, interval, discreta).

Variabila

Tipul variabilei

Scala

TAS

TAD

Varsta

Talia

Greutate

Scor Apgar

Varsta gestationala

Sex

  1. Se urmareste estimarea indicatorilor de centralitate, dispersie si localizare pentru talie, greutate. (Folositi functiile statistice din Excel). Interpretati din punct de vedere statistic si medical rezultatele obtinute.
  2. Folosind coeficientul de variatie, sa se stabileasca nivelul de omogenitate a seriilor greutatea si TAS. Interpretati din punct de vedere statistic si medical rezultatele obtinute.
  3. Pentru scorul Apgar se doreste estimarea parametrilor de centralitate si localizare. (Folositi functiile statistice din Excel). Interpretati din punct de vedere statistic si medical rezultatele obtinute.
  4. Calculati statisticile descriptive (folosind Data Analysis) pentru primele 5 variabile si interpretati rezultatele obtinute.

Se pot utiliza urmatoarele functii Excel:

  1. AVERAGE - Media aritmetica.
  2. MEDIAN - Mediana
  3. MODE - Modulul
  4. VARP - Variatia populatiei (se calculeaza numai daca avem in studiu o populatie)
  5. VAR - Variatia de selectie
  6. STDEVP - Abaterea standard a populatiei (se calculeaza numai daca avem in studiu o populatie)
  7. STDEV - Abaterea standard de selectie
  8. STDEV/AVERAGE - Coeficientul de variatie
  9. QUARTILE- Cvartila 1,2,3,4 
  10. AVEDEV - media deviatiei de la media aritmetica
  11. DEVSQ - suma de patrate a deviatiilor valorilor de la media aritmetica
  12. GEOMEAN- media geometrica
  13. HARMEAN - media armonica
  14. KURT- boltirea sau kurtosis-ul
  15. MAX - maximul
  16. MIN - minimul
  17. PERCENTILE - returneaza a k-a percentila
  18. SKEW - asimetria

Instructiuni:

Pentru rezolvarea punctelor 4 si 6 se poate proceda construind un tabel folosind modelul alaturat (Atentie, celulele pe fond verde marcate cu X pot fi calculate folosind formulele Excel si au o semnificatie statistica):

In celulele marcate se poate efectua calculul corespunzator functiei mentionate la inceputul liniei.

In celula corespunzatoare mediei aritmetice pentru TAS (care se poate introduce si direct, scriind    =AVERAGE(A2:A20)), introducem functia AVERAGE: din meniul INSERT, optiunea FUNCTION, schimbam categoria din Most recently used in Statistical:

Cautam functia in lista de functii statistice disponibile, o selectam, apoi apasam OK.

Introducem domeniul pe care se afla variabilele: A2:A20 pentru prima variabila.

Pentru urmatoarele variabile calculam suma astfel: selectam domeniul in care se afla variabila, din meniul Edit alegem optiunea Fill Right.

In mod analog se vor calcula functiile: MEDIAN, MODE, VAR, STDEV, AVEDEV, DEVSEQ, KURT, MAX, MIN, SKEW.

Pentru functiile: Quartile se va proceda astfel: dupa alegerea functiei  din lista de functii se vor introduce doua argumente: Array si Quart.

Array va fi domeniul in care sunt valorile variabilei TAS  A2 :A20. Quart va avea valoarea 0 pentru prima cuartila care va corespunde cu minimul, 1 pentru a doua cuartila, 2 pentru a treia cuartila care va corespunde medianei, 3 pentru a patra cuartila, 4 pentru a cincea cuartila care va corespunde maximului.

Pentru functia Percentile se vor introduce parametrii Array si K. Array este in mod analog cu paragraful anterior : domeniul pe care este variabila, iar Exemplu : k=0.9 corespunde celei de a zecea decila.

Obs. Calculul percentilelor are sens numai daca in studiu sunt inclusi mai mult de 100 de subiecti.

Utilizarea pachetului Data Analysis pentru calculul Statisticilor descriptive

Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta, verificati daca nu a fost instalat deja: deschideti meniul Tools. Daca optiunea Data Analysis este prezenta, atunci se trece la pasul urmator. Daca optiunea Data Analysis nu este prezenta, atunci din meniul Tools se alege optiunea Add-Ins. Va aparea o fereastra asemanatoare celei de mai jos in care se va bifa prima optiune Analysis ToolPak. Apasati butonul Ok.

Alegeti optiunea Data Analysis din meniul Tools. Din fereastra de dialog care apare selectam Descriptive Statistics. Clic pe OK.

Dupa apasarea butonului OK pe ecran va aparea urmatoarea fereastra de dialog:

Urmeaza o descriere a campurilor ferestrei de dialog de mai sus:

  1. Input Range: Introduceti referintele domeniului unde se gaseste variabila pentru care dorim sa calculam parametrii statisticii descriptive. In cazul nostru: A1:E20. Pentru introducere executati click in campul Input Range, apoi click in celula A1 si executati o selectie pana in celula E20.
  2. Grouped by: se va selecta Columns daca fiecare variabila este introdusa intr-o coloana sau Rows daca fiecare variabila este introdusa  intr-o linie. In cazul nostru vom bifa Columns.
  3. Labels in first row. Antetul de coloana sau linie poate sa fie selectat sau poate lipsi. Daca selectam si antetul de coloana, atunci in pagina de rezultate va aparea acel antet, adica numele variabilei. In acest caz trebuie sa bifam Labels in first row. Daca nu bifam functia va intoarce eroarea: "Input range contents non numeric data", deoarece se considera si antetul de coloana ca fiind una dintre valorile variabilei. In cazul in care nu selectam antetul de coloana, ar trebui sa nu bifam nici Labels in first row. Daca bifam Labels in first row atunci prima valoare a variabilei va fi luata drept antet de coloana si rezultatele vor fi gresite. In cazul nostru selectam labels in first row.
  4. Optiunile Output se refera la locul amplasarii tabelului de frecventa. Vom selecta optiunea New Worksheet Ply. Tabelul de frecventa va fi afisat la o pagina noua al carei nume trebuie introdus in campul New Worksheet Ply, in cazul nostru Stat. descr. Output Range este pentru cazul in care dorim ca rezultatul sa fie afisat pe aceeasi pagina cu tabelul incepand cu o anumita celula care trebuie introdusa in campul Output Range. New Woorkbook se bifeaza in cazul in care dorim ca rezultatul sa fie afisat intr-un alt fisier.

Cel putin una dintre urmatoarele optiuni trebuie selectate.

  1. Summary statistics se bifeaza pentru ca sa se calculeze parametrii statistici principali.
  2. Confidence Level for Mean se bifeaza daca se doreste sa calculeze si intervalul de confidenta pentru media aritmetica. Nivelul de confidenta implicit este 95%, se poate schimba cu un alt numar cuprins in intervalul (1; 100).
  3. Kth Largest intoarce numarul al k-lea mai mic decat numarul cel mai mare. K este o constanta care se introduce in campul corespunzator.
  4. Kth Smallest intoarce numarul al k-lea mai mare decat numarul cel mai mic. K este o constanta care se introduce in campul corespunzator. Poate fi diferit de K de la punctul 7.
  5. Click OK. Rezultatul va aparea intr-o foaie noua cu numele Stat. Descr. asemanator cu cel de mai jos:

 

Interpretarea rezultatelor

Mean - Media aritmetica. Se poate calcula si cu functia AVERAGE.

Standard Error - Eroarea standard. Se poate calcula si cu functia STDEV.

Median - Mediana este o valoare a seriei astfel incat jumatate dintre observatii au valori mai mici (sau egale) si cealalta jumatate au valori mai mari (sau egale). Se poate calcula si cu functia MEDIAN.

Mode - Modulul este valoarea care are cea mai mare frecventa din serie. In cazul modulului o situatie care apare este cea in care seria nu are modul, adica toate valorile apar o singura data. Atunci va fi afisata valoarea #N/A. O alta situatie posibila este ca seria sa fie bimodala sau trimodala. Atunci va fi afisata numai prima valoare in ordinea aparitiei lor in cadrul seriei. In acest caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecventa. Se poate calcula si cu functia MODE.

Standard Deviation - Deviatia standard sau Abaterea standard se poate calcula si cu STDEV sau pentru deviatia standard populationala STDEVP.

Sample Variance - Variatia se poate calcula si cu VAR sau pentru variatia populationala VARP

Kurtosis - Excesul sau Boltirea masoara inaltimea aplatizarii sau boltirii unei distributii in comparatie cu o distributie normala.

Excesul a este zero pentru o serie de date avand o distributie normala, este pozitiv pentru o serie de date avand trena mai inalta decat cea a unei distributii normale (cu media  si variatia S2) si este negativ pentru o serie de date a carei trena este mai coborata decat cea a unei distributii normale. In cazul nostru valoarea -0,99 a boltirii indica o curba putin mai aplatizata decat curba normala. Se poate calcula si cu functia KURT.

Skewness - Asimetria masoara abaterea de la aspectul simetric si directia asimetriei (pozitiva sau negativa) fata de curba normala.

Asimetria este 0 pentru o serie de date avand o distributie normala, este negativa pentru o serie de date asimetrica spre stanga (seria are mai multe valori mai mici), este pozitiva pentru o serie de date asimetrica spre dreapta (seria are mai multe valori mai mari). In cazul nostru asimetria este 0,02, deci este putin deplasata la dreapta fata de curba normala. Se poate calcula si cu functia SKEW.

Range - Intervalul este diferenta Maximul-Minimul seriei de date.

Minimum - Minimul valoarea cea mai mica din serie. Se poate calcula si cu functia MIN.

Maximum - Maximul valoarea cea mai mare din serie. Se poate calcula si cu functia MAX

Sum - Suma sau Totalul valorilor seriei. Se poate calcula si cu functia SUM.

Count - Numarul de observatii n=20. Se poate calcula si cu functia COUNT.

Quartilele si percentilele sunt asemanatoare medianei. Astfel, prima cvartila sau este o valoare avand proprietatea ca 25% dintre datele seriei sunt mai mici sau egale cu ea, iar 75% mai mari sau egale cu prima cvartila. A doua cvartila este reprezentata de mediana. A treia cvartila este o valoare avand proprietatea ca 75% dintre datele seriei sunt mai mici sau egale cu ea iar 25% mai mari sau egale cu a treia cvartila.

Percentila de ordinul a este o valoar cu proprietatea ca o proportie egala cu a din date sunt mai mici sau egale, iar celelalte sunt mai mari.

CV=STDEVP/AVERAGE - Coeficientul de variatie : se pot utiliza urmatoarele reguli empirice pentru interpretare:

daca CV este sub 10% atunci populatia poate fi considerata omogena;

daca CV este intre 10%-20% atunci populatia poate fi considerata relativ omogena;

daca CV este intre 20%-30% atunci populatia poate fi considerata relativ eterogena;

daca CV este peste 30% atunci populatia poate fi considerata eterogena.



Politica de confidentialitate | Termeni si conditii de utilizare



DISTRIBUIE DOCUMENTUL

Comentarii


Vizualizari: 4790
Importanta: rank

Comenteaza documentul:

Te rugam sa te autentifici sau sa iti faci cont pentru a putea comenta

Creaza cont nou

Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved