CATEGORII DOCUMENTE |
Statistica descriptiva
Problema Se face un studiu pe un lot format din 20 de pacienti la care se urmaresc parametrii biomedicali: tensiunea arteriala diastolica (TAD) (mmHg), tensiunea arteriala sistolica (TAS) (mmHg), varsta (zile), talia(cm), greutate(grame), scor Apgar, Varsta gestationala(saptamani), Sex. Datele sunt prezentate in tabelul de mai jos:
TAS (mmHg) |
TAD (mmHg) |
Varsta (zile) |
Talia (cm) |
Greutate (grame) |
Scor Apgar |
Varsta gestationala (saptamani) |
Sex(M/F) |
180 |
80 |
43 |
55 |
5500 |
10 |
40 |
M |
170 |
70 |
67 |
52 |
4100 |
9 |
39 |
M |
175 |
100 |
28 |
56 |
3700 |
8 |
38 |
F |
120 |
50 |
49 |
53 |
5200 |
10 |
41 |
M |
110 |
65 |
21 |
61 |
4200 |
9 |
41 |
M |
140 |
70 |
54 |
50 |
2800 |
6 |
30 |
F |
110 |
85 |
72 |
55 |
4300 |
9 |
36 |
M |
130 |
95 |
80 |
60 |
4200 |
9 |
35 |
F |
140 |
105 |
43 |
51 |
4900 |
10 |
38 |
F |
135 |
50 |
51 |
56 |
4400 |
9 |
37 |
F |
120 |
55 |
21 |
52 |
5400 |
10 |
39 |
F |
100 |
60 |
35 |
55 |
5600 |
10 |
39 |
M |
140 |
90 |
34 |
54 |
5100 |
9 |
36 |
M |
130 |
75 |
56 |
56 |
5200 |
10 |
38 |
F |
160 |
80 |
78 |
59 |
4000 |
8 |
37 |
M |
170 |
90 |
45 |
56 |
3800 |
9 |
39 |
F |
165 |
85 |
32 |
52 |
4500 |
10 |
40 |
F |
150 |
65 |
54 |
49 |
4200 |
7 |
37 |
M |
155 |
70 |
76 |
55 |
4900 |
9 |
38 |
F |
Cerinte
Variabila |
Tipul variabilei |
Scala |
TAS | ||
TAD | ||
Varsta | ||
Talia | ||
Greutate | ||
Scor Apgar | ||
Varsta gestationala | ||
Sex |
Se pot utiliza urmatoarele functii Excel:
Instructiuni:
Pentru rezolvarea punctelor 4 si 6 se poate proceda construind un tabel folosind modelul alaturat (Atentie, celulele pe fond verde marcate cu X pot fi calculate folosind formulele Excel si au o semnificatie statistica):
In celulele marcate se poate efectua calculul corespunzator functiei mentionate la inceputul liniei.
In celula corespunzatoare mediei aritmetice pentru TAS (care se poate introduce si direct, scriind =AVERAGE(A2:A20)), introducem functia AVERAGE: din meniul INSERT, optiunea FUNCTION, schimbam categoria din Most recently used in Statistical:
Cautam functia in lista de functii statistice disponibile, o selectam, apoi apasam OK.
Introducem domeniul pe care se afla variabilele: A2:A20 pentru prima variabila.
Pentru urmatoarele variabile calculam suma astfel: selectam domeniul in care se afla variabila, din meniul Edit alegem optiunea Fill Right.
In mod analog se vor calcula functiile: MEDIAN, MODE, VAR, STDEV, AVEDEV, DEVSEQ, KURT, MAX, MIN, SKEW.
Pentru functiile: Quartile se va proceda astfel: dupa alegerea functiei din lista de functii se vor introduce doua argumente: Array si Quart.
Array va fi domeniul in care sunt valorile variabilei TAS A2 :A20. Quart va avea valoarea 0 pentru prima cuartila care va corespunde cu minimul, 1 pentru a doua cuartila, 2 pentru a treia cuartila care va corespunde medianei, 3 pentru a patra cuartila, 4 pentru a cincea cuartila care va corespunde maximului.
Pentru functia Percentile se vor introduce parametrii Array si K. Array este in mod analog cu paragraful anterior : domeniul pe care este variabila, iar Exemplu : k=0.9 corespunde celei de a zecea decila.
Obs. Calculul percentilelor are sens numai daca in studiu sunt inclusi mai mult de 100 de subiecti.
Utilizarea pachetului Data Analysis pentru calculul Statisticilor descriptive
Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta, verificati daca nu a fost instalat deja: deschideti meniul Tools. Daca optiunea Data Analysis este prezenta, atunci se trece la pasul urmator. Daca optiunea Data Analysis nu este prezenta, atunci din meniul Tools se alege optiunea Add-Ins. Va aparea o fereastra asemanatoare celei de mai jos in care se va bifa prima optiune Analysis ToolPak. Apasati butonul Ok.
Alegeti optiunea Data Analysis din meniul Tools. Din fereastra de dialog care apare selectam Descriptive Statistics. Clic pe OK.
Dupa apasarea butonului OK pe ecran va aparea urmatoarea fereastra de dialog:
Urmeaza o descriere a campurilor ferestrei de dialog de mai sus:
Cel putin una dintre urmatoarele optiuni trebuie selectate.
Interpretarea rezultatelor
Mean - Media aritmetica. Se poate calcula si cu functia AVERAGE.
Standard Error - Eroarea standard. Se poate calcula si cu functia STDEV.
Median - Mediana este o valoare a seriei astfel incat jumatate dintre observatii au valori mai mici (sau egale) si cealalta jumatate au valori mai mari (sau egale). Se poate calcula si cu functia MEDIAN.
Mode - Modulul este valoarea care are cea mai mare frecventa din serie. In cazul modulului o situatie care apare este cea in care seria nu are modul, adica toate valorile apar o singura data. Atunci va fi afisata valoarea #N/A. O alta situatie posibila este ca seria sa fie bimodala sau trimodala. Atunci va fi afisata numai prima valoare in ordinea aparitiei lor in cadrul seriei. In acest caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecventa. Se poate calcula si cu functia MODE.
Standard Deviation - Deviatia standard sau Abaterea standard se poate calcula si cu STDEV sau pentru deviatia standard populationala STDEVP.
Sample Variance - Variatia se poate calcula si cu VAR sau pentru variatia populationala VARP
Kurtosis - Excesul sau Boltirea masoara inaltimea aplatizarii sau boltirii unei distributii in comparatie cu o distributie normala.
Excesul a este zero pentru o serie de date avand o distributie normala, este pozitiv pentru o serie de date avand trena mai inalta decat cea a unei distributii normale (cu media si variatia S2) si este negativ pentru o serie de date a carei trena este mai coborata decat cea a unei distributii normale. In cazul nostru valoarea -0,99 a boltirii indica o curba putin mai aplatizata decat curba normala. Se poate calcula si cu functia KURT.
Skewness - Asimetria masoara abaterea de la aspectul simetric si directia asimetriei (pozitiva sau negativa) fata de curba normala.
Asimetria este 0 pentru o serie de date avand o distributie normala, este negativa pentru o serie de date asimetrica spre stanga (seria are mai multe valori mai mici), este pozitiva pentru o serie de date asimetrica spre dreapta (seria are mai multe valori mai mari). In cazul nostru asimetria este 0,02, deci este putin deplasata la dreapta fata de curba normala. Se poate calcula si cu functia SKEW.
Range - Intervalul este diferenta Maximul-Minimul seriei de date.
Minimum - Minimul valoarea cea mai mica din serie. Se poate calcula si cu functia MIN.
Maximum - Maximul valoarea cea mai mare din serie. Se poate calcula si cu functia MAX
Sum - Suma sau Totalul valorilor seriei. Se poate calcula si cu functia SUM.
Count - Numarul de observatii n=20. Se poate calcula si cu functia COUNT.
Quartilele si percentilele sunt asemanatoare medianei. Astfel, prima cvartila sau este o valoare avand proprietatea ca 25% dintre datele seriei sunt mai mici sau egale cu ea, iar 75% mai mari sau egale cu prima cvartila. A doua cvartila este reprezentata de mediana. A treia cvartila este o valoare avand proprietatea ca 75% dintre datele seriei sunt mai mici sau egale cu ea iar 25% mai mari sau egale cu a treia cvartila.
Percentila de ordinul a este o valoar cu proprietatea ca o proportie egala cu a din date sunt mai mici sau egale, iar celelalte sunt mai mari.
CV=STDEVP/AVERAGE - Coeficientul de variatie : se pot utiliza urmatoarele reguli empirice pentru interpretare:
daca CV este sub 10% atunci populatia poate fi considerata omogena;
daca CV este intre 10%-20% atunci populatia poate fi considerata relativ omogena;
daca CV este intre 20%-30% atunci populatia poate fi considerata relativ eterogena;
daca CV este peste 30% atunci populatia poate fi considerata eterogena.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 4774
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved