CATEGORII DOCUMENTE |
Analiza statistica a datelor in raport cu doua
variabile
1. Cazul a doua variabile nominale
Tabele de repartitie bidimensionale pentru a reda distributia esantionului in raport cu 2 variabile se procedeaza astfel: Analyze - Descriptive Statistics - Crosstabs:
In fereastra Cells putem opta pentru optiunea Counts Observed, caz in care ne va afisa tabelul bidimensional cu ajutorul frecventelor absolute, sau alegand optiunea Percentages, vom obtine distributia esantionului in raport cu cele 2 variabile cu ajutorul frecventelor relative.
daca ar fi a alegeti din nou pentru ce specializare ati opta? |
Total |
|||
aceeasi |
alta | |||
ce specializare urmati? |
CIG | |||
REI | ||||
FB | ||||
MK | ||||
MG | ||||
IE | ||||
SPE | ||||
ECTS | ||||
EA | ||||
Total |
Interpretare: tabelul reda distributia studentilor din esantion in raport cu cele doua variabile, fiind construit cu ajutorul frecventelor absolute. Ultima coloana si ultimul rand din tabelul de frecvente corespund repartitiilor marginale.
Ex: doar 2 din cei 24 de studenti chestionati de la sectia de marketing ar alege alta specializare.
daca ar fi a alegeti din nou pentru ce specializare ati opta? |
Total |
|||
aceeasi |
alta | |||
ce specializare urmati? |
CIG | |||
REI | ||||
FB | ||||
MK | ||||
MG | ||||
IE | ||||
SPE | ||||
ECTS | ||||
EA | ||||
Total |
Aceeasi distributie a esantionului in raport cu cele doua variabile
poate fii redata si cu ajutorul frecventelor relative. Se observa ca 21,3% din
totalul studentilor ar alege alta sectie, un procent insemnat avand cei de la
sectia management (5,9%).
Grafice adecvate in acest caz sunt diagramele prin coloane.
Analiza asocierii dintre cele doua variabile presupune in prima etapa verificarea existentei legaturii dintre cele doua variabile cu ajutorul testului χsi apoi interpretarea coeficientului de contingenta pentru a analiza gradul de asociere dintre variabile. Din meniul Analyze - Descriptive Statistics - Crosstabs se aleg cele doua variabile si in fereastra Statistics se selecteaza parametrii doriti.
Se formuleaza ipotezele referitoare la existenta legaturii:
H: χ= 0 ( nu exista legatura )
H: χ≠ 0
Value |
df |
Asymp. Sig. (2-sided) |
|
Pearson Chi-Square | |||
Likelihood Ratio | |||
Linear-by-Linear Association | |||
N of Valid Cases |
Interpretare: putem afirma cu o probabilitate de 95% ( Sig.< 0,05 ) ca intre cele doua variabile exista legatura.
Value |
Approx. Sig. |
||
Nominal by Nominal |
Contingency Coefficient | ||
N of Valid Cases |
2. Cazul a doua variabile ordinale
Tabele de repartitie bidimensionale si in acest caz prezinta importanta repartitia esantionului in raport cu cele variabile atat sub forma frecventelor absolute, cat si relative. Aceasta prezentare a datelor presupune urmatorii pasi: Analyze - Descriptive Statistics - Crosstabs, in fereastra Cells alegand si optiunea Percentages. Cele doua tipuri de frecvente, absolute si relative, se pot prezenta in acelasi tabel de repartitie.
Grafice informatii privind repartitia esantionului in raport cu doua variabile ordinale sunt disponibile si din vizualizarea graficului adecvat - diagrama prin benzi. Modul de obtinere a acestuia este: Graphs - Bar - Clustered.
Analiza corelatiei se realizeaza cu ajutorul coeficientului lui Kendall, astfel: Analyze - Descriptive Statistics - Crosstabs, selectand in fereastra Statistics acest coeficient.
Value |
Asymp. Std. Error |
Approx. T |
Approx. Sig. |
||
Ordinal by Ordinal |
|
| |||
N of Valid Cases |
Valoarea coeficientului lui Kendall de - 0,252 indica faptul ca intre media anului precedent si ordinea repartizarii pe sectii a studentilor exista o legatura inversa, de intensitate slaba. Cu cat studentii au o medie mai mare, cu atat au sansa de a fi repartizati in sectia pentru care si-au exprimat prima preferinta.Valoarea coeficientului este semnificativ diferita de 0 cu o probabilitate de 95% ( Sig.= 0,000 < 0,05 ).
3. Cazul a doua variabile cantitative
Tabele de repartitie bidimensionale se parcurg aceleasi etape ca si mai sus;
Grafice pentru a reda repartitia esantionului folosim in acest caz norul statistic. Demersul pentru construirea acestuia este: Graphs - Scatter - Simple. Construirea norului statistic constituie prima etapa in analiza legaturii dintre doua variabile numerice. In functie de pozitiile punctelor norului putem formula de asemenea ipoteze cu privire la forma functiei care explica legatura dintre variabile.
Se observa in distributia punctelor o valoare extrema ( 18 ore curs ); se recomanda ca valorile extreme sa fie inlaturate inaintea aplicarii testelor statistice pentru a nu influenta calitatea rezultatelor.
Analiza corelatiei - presupune calculul coeficientului lui Pearson, utilizand meniul Analyze - Correlate - Bivariate.
Vom analiza legatura dintre numarul de ore de curs si cele de seminar frecventate de studenti intr-o saptamana. Coeficientul lui Pearson ne ofera informatii atat despre sensul legaturii, cat si despre intensitatea legaturii.
cate ore de curs ati frecventat sapt trecuta |
cate ore de seminar ati frecventat sapt trecuta |
||
cate ore de curs ati frecventat sapt trecuta |
Pearson Correlation | ||
Sig. (2-tailed) | |||
N | |||
cate ore de seminar ati frecventat sapt trecuta |
Pearson Correlation | ||
Sig. (2-tailed) | |||
N |
Valoarea acestui coeficient este semnificativ diferita de 0, ipoteza existentei legaturii fiind acceptata cu o probabilitate de 95% ( Sig.< 0,05 ).
Daca analizam din nou corelatia dintre cele doua variabile, dar dupa indepartarea valorilor extreme din esantion, rezultatele vor fi mai concludente:
Correlations
cate ore de seminar ati frecventat sapt trecuta |
cate ore de curs ati frecventat sapt trecuta |
||
cate ore de seminar ati frecventat sapt trecuta |
Pearson Correlation | ||
Sig. (2-tailed) | |||
N | |||
cate ore de curs ati frecventat sapt trecuta |
Pearson Correlation | ||
Sig. (2-tailed) | |||
N |
4. Testarea egalitatii a doua medii ( esantioane independente ) - este un test parametric care verifica daca mediile a doua grupe sunt egale. In SPSS presupune urmatorul demers: Analyze - Compare Means - Independent Samples T Test.
De exemplu, dorim sa testam daca, la nivelul esantionului observat, numarul mediu de ore de curs frecventate de studentii din anul 4 este diferit de numarul mediu de ore de curs frecventate de studentii din anul 5.
Variabila de grupare va fi in acest caz anul de studiu, in definirea grupelor tinand cont de codificarile facute pentru starile acesteia ( 1 - anul 4, 2 - anul 5 ).
Ipoteza privind egalitatea mediilor se formuleaza astfel:
H: =
H: ≠
anul de studiu |
N |
Mean |
Std. Deviation |
Std. Error Mean |
|
cate ore de curs ati frecventat sapt trecuta | |||||
Dorim sa verificam daca numarul mediu de ore de curs frecventate de studentii din anul 4 ( 5,29≈5 ), difera semnificativ de 3,65≈4 (numarul mediu de ore de curs frecventate de studentii din anul 5 ).
Constructia testului pentru compararea mediilor a doua esantioane presupune testarea in prealabil a egalitatii variantelor la nivelul celor doua grupe. Statistica t se calculeaza diferit dupa cum dispersiile sunt egale sau nu la nivelul celor doua grupe. Ca urmare, formulam ipoteza nula si alternativa referitoare la egalitatea dispersiilor:H: σ= σ iar H: σ≠ σ
Levene's Test for Equality of Variances |
t-test for Equality of Means |
||||||
F |
Sig. |
t |
df |
Sig. (2-tailed) |
Mean Difference |
||
cate ore de curs ati frecventat sapt trecuta |
Equal variances assumed | ||||||
Equal variances not assumed |
5. Testarea legaturii dintre doua variabile - dorim sa verificam daca modificarea variabilei dependente Y este rezultatul influentei variabilei explicative X. Pentru a testa existenta legaturii procedam astfel: Analyze - Compare Means - One Way Anova. ANOVA este un procedeu de analiza a unei variabile numerice sub influenta unei variabile de grupare care prezinta mai multe stari.
De exemplu dorim sa verificam daca exista legatura intre numarul de ore de curs frecventate si media anuala.
In meniul Options avem posibilitatea selectarii graficului pentru a formula ipoteze cu privire la forma legaturii dintre cele doua variabile.
Sum of Squares |
df |
Mean Square |
F |
Sig. |
|
Between Groups | |||||
Within Groups | |||||
Total |
Se formuleaza ipoteza nula H: F = 0, adica dispersia dintre grupe este nula si deci grupele nu sunt diferite intre ele, adica media anuala nu influenteaza numarul orelor de curs frecventate de studenti. Deoarece probabilitatea de a gresi cand respingem ipoteza este 0,016< 0,05, rezulta ca ipoteza nula se respinge, adica media influenteaza frecventa la cursuri,. In cadrul fiecarui interval al mediei anului precedent, studentii sunt relativ omogeni din punct de vedere al frecventarii cursurilor, media anului precedent fiind un criteriu semnificativ de segmentare.
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 2011
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved