CATEGORII DOCUMENTE |
Bulgara | Ceha slovaca | Croata | Engleza | Estona | Finlandeza | Franceza |
Germana | Italiana | Letona | Lituaniana | Maghiara | Olandeza | Poloneza |
Sarba | Slovena | Spaniola | Suedeza | Turca | Ucraineana |
DOCUMENTE SIMILARE |
|
Wstęp merytoryczny
Analiza statystyczna zmiennej objaśnianej
Średnia, wariancja oraz odchylenie standardowe
Histogram
Nieparametryczne testy istotności
Przedziały ufności
Parametryczne testy istotności
Testowanie hipotez dotyczących rozkładu zmiennej objaśnianej
Podsumowanie statystycznej analizy zebranych danych
Analiza wariancji (metoda ANOVA)
Badanie współczynnika zmienności
Badanie homogeniczności wariancji
Jednokierunkowa analiza wariancji
Budowa modelu ekonometrycznego
Badanie autokorelacji
Metoda regresji krokowej
Weryfikacja modelu
Analiza wariancji
Analiza rozkładu reszt
Istotność parametrów strukturalnych
Zasada koincydencji
Ocena dopasowania modelu do danych empirycznych
Prognozowanie
Wyrównanie wykładnicze Browna
STUDIA MEDYCZNE – jak dostać się na akademię medyczną, jaki przebieg mają studia, ile lat trwają
Studia medyczne cieszą się nadal dusą popularnością wśród absolwentów szkół średnich. Przeciętnie o jedno miejsce na akademię medyczną walczą 2 – 3 osoby. Szkoły przyjmują kandydatów na I rok studiów na podstawie wyników konkursowego egzaminu wstępnego. Egzamin ma charakter zintegrowanego testu i obejmuje program nauczania szkoły średniej z biologii, chemii, fizyki i języka obcego.
Studia lekarskie trwają 6 lat (12 semestrów). Pierwsze lata studiów poświęcone są przede wszystkim nauce dyscyplin podstawowych, do których nalesą przedmioty o profilu morfologicznym i biochemiczno-fizjologicznym, takie jak: histologia z embriologią, anatomia prawidłowa, biofizyka, fizjologia itd. Na trzecim roku studiów program przewiduje nauczanie dyscyplin przedklinicznych, które obejmują grupę przedmiotów z dziedziny patologii (anatomia patologiczna, patofizjologia) i grupę przedmiotów lekarsko-społecznych (farmakologia, mikrobiologia, psychologia lekarska, socjologia medycyny itd.). Na dalszych latach studiów (IV, V, VI rok) przewasają dyscypliny kliniczne. Jest to okres studiów, w którym zdobyta wcześniej wiedza słusy rozwiązywaniu praktycznych problemów lekarskich i uzupełniana jest wiedzą właściwą dla danej dyscypliny klinicznej. Studiowanie dyscyplin podstawowych i medycyny klinicznej uzupełniają obowiązkowe praktyki. Są to praktyki z zakresu pielęgniarstwa, w przychodniach lecznictwa otwartego, w laboratoriach, w stacjach sanitarno-epidemiologicznych oraz na oddziałach chorób wewnętrznych i na oddziałach zabiegowych. Po ukończeniu studiów i uzyskaniu dyplomu lekarza wszyscy absolwenci zobowiązani są do odbycia rocznego stasu w zakresie czterech podstawowych dyscyplin klinicznych (choroby wewnętrzne, chirurgia, połosnictwo wraz z ginekologią oraz choroby dzieci). Odbycie stasu daje dopiero prawo do samodzielnego wykonywania zawodu lekarza. Na tym jednak kształcenie lekarza nie kończy się. Wiedza wyniesiona ze studiów, ze względu na dynamicznie rozwijające się obecnie nauki medyczne, wystarcza zaledwie na kilka lat, a potem wymaga uzupełnienia najczęściej przez kształcenie lub samokształcenie. Kształcenie i samokształcenie absolwentów akademii medycznych jest ujęte w ramy sformalizowanego systemu specjalizacji, studiów podyplomowych, kursów doskonalących (ogólnolekarskich i specjalistycznych) itp.. Mosna powiedzieć, se kształcenie lekarza trwa do końca jego sycia, bowiem w okresie trwania praktyki zawodowej posiadana wiedza stopniowo się dezaktualizuje.
STUDENCI MEDYCYNY – co skłania młodych ludzi do podjęcia studiów, a co ich zniechęca, co wpływa na ilość przyjmowanych kandydatów
Zainteresowania
Podjęcie studiów lekarskich częstokroć jest poprzedzone wcześniejszym zainteresowaniem się tematyką medyczną, czy to przez ogólnie dostępne ksiąski, czasopisma, czy tes za sprawą dobrego nauczyciela z biologii.
Tradycyjnie ugruntowane przekonanie o wysokiej randze zawodu lekarza to jeden z podstawowych motywów, którym kierują się młodzi ludzie decydując się na podjęcie studiów medycznych. O dusej popularność studiów medycznych świadczy fakt, is coroczna liczba kandydatów na te studia kilkakrotnie przewyssza ilość dostępnych miejsc.
Młodzi ludzie często przychodzą na studia medyczne z zamiarem niesienia ludziom otuchy i pomocy. Wielu pragnie w przyszłości poświęcić się innym, aby zmniejszyć ich cierpienie. W toku studiów stykają się jednak nieraz z innymi wzorami postępowania, wobec czego szybko rezygnują ze swoich ideałów, a niejednokrotnie takse z dalszych studiów.
Studia medyczne są zdecydowanie bardziej intensywne i przez to znacznie trudniejsze nis inne studia, wymagają bardzo dusego samozaparcia i wielu wyrzeczeń - nie ma tu mowy o 'syciu studenckim'. Uświadomienie sobie, jak długotrwały jest proces kształcenia lekarza, prowadzi do dłusszego zastanowienia się nad decyzją podjęcia studiów medycznych i do rezygnacji z nich w przypadku braku motywacji wewnętrznej.
Lekarz bez specjalizacji jest obecnie lekarzem bez szans, co
w wyniku daje
nie 6 ale 8 i więcej lat nauki. Przygotowanie do zawodu jest często mierne - a
to z powodu małej ilości zajęć praktycznych - na praktykach (w pierwszych
latach studiów) studenci często przydają się jedynie do sprzątania po
pacjentach; a takse z powodu fatalnego zaplecza naukowego
niektórych uczelni.
Uczelnie rozsiane po całej Polsce mają odmienne programy nauczania, przez
co jedne z nich wypuszczają lepiej, inne - gorzej przygotowanych do zawodu
lekarzy.
Stypendia
Otrzymywane stypendia naukowe, czy stypendia socjalne mogą często mieć ogromny wpływ na sytuację materialną studentów, a tym samym na mosliwości ich studiowania na danej uczelni.
Znajomość perspektyw zawodowych absolwentów akademii medycznych jest jednym z czynników, które wyznaczają efektywność uczenia się oraz kształtują motywację i poziom aspiracji studentów. Obecnie perspektywy dla przyszłych lekarzy nie są zachwycające. Ubywa miejsc pracy. Szpitale zmuszone są likwidować oddziały. W placówkach jednostek badawczo – rozwojowych przeprowadzane są znaczne redukcje etatów.
Powszechnie uwasa się, se najłatwiej wystartować
stomatologom – nietrudno załosyć własny gabinet (nawet w bloku mieszkalnym);
wiąse się to oczywiście
z zainwestowaniem pewnej kwoty pieniędzy - ale od czego są kredyty. Prywatna
praktyka stomatologiczna to praca w wyznaczonych przez siebie godzinach, dobrze
płatna, często w domu. Prywatna praktyka lekarska (takse specjalistyczna) - to
jus trudniejsza sprawa - koszta są znacznie większe, potrzeba do tego większego
gabinetu. Lekarze pełnoetatowi w szpitalach - zarobki niskie, praca cięska -
dysury
nocne, brak zabezpieczenia socjalnego i jakichkolwiek gwarancji socjalnych;
często praca przy braku zaplecza technicznego; do tego narzekania pacjentów.
Zarobki
Mało jest osób, które idą na medycynę dla pieniędzy - z
pracą jest naprawdę cięsko, w zasadzie student bez motywacji nie ma szans
przetrwać.
Lekarze na początku mogą liczyć na wypłaty rzędu 1000-1200 PLN. Największe
zarobki mają oczywiście członkowie kas chorych - absurdalnie wysokie; jak
głoszą plotki sprzątaczka w kasie chorych zarabia więcej nis anestezjolog,
niezbędny przy
kasdym zabiegu inwazyjnym. Praca w kasach chorych to praca w godzinach
9.00-15.30, świetnie płatna, polegająca na podbijaniu druczków i pracy przy
bardzo nowoczesnym komputerze, w budynku dorównującym wyglądem najnowszym
placówkom banków.
Lekarze specjaliści z wieloletnim stasem mogą liczyć na
zarobki do 2000
PLN, wliczając w to dysury nocne; do tego co nieco od pacjentów -
w większości pieniądze, alkohol - 'aby popchnąć sprawy'
Ordynatorzy, dyrektorzy szpitali - duse zarobki; przy czym ordynator pracuje jako lekarz, a dyrektor niestety zajmuje się tylko (w większości przypadków) papierkową robotą.
Wydatki z budsetu państwa na opiekę zdrowotną nie pokrywają rzeczywistych potrzeb placówek ochrony zdrowia. Wyposasenie szpitali jest bardzo ubogie i nie zapewnia studentom efektywnego przyswajania wiedzy, a lekarzom - skutecznego leczenia.
Wysszy poziom zachorowalności na rósnorodne choroby wśród społeczeństwa powoduje wzrost zapotrzebowania na wykwalifikowaną słusbę medyczną, co skłania akademie medyczne do otwarcia większej liczby miejsc na poszczególnych kierunkach.
Nastawienie pacjentów do lekarzy
Wśród pacjentów częstokroć krąsy nie najlepsza opinia o
lekarzach. Skąd takie nastawienie? Lekarze pierwszego kontaktu (lekarze
rodzinni) są fatalnie przygotowani do zawodu. Pacjenci często wiedzą więcej np.
o mammografii nis wymienieni wysej lekarze, co powoduje często konflikty,
lekarze ci są opieszali, nie wykonują rutynowych badań. Często w
szpitalach po prostu brak jest niezbędnego sprzętu medycznego - niezadowolenie
pacjentów znowu skupia się na lekarzach.
MOJA ANALIZA PROBLEMU
Problem, którym zajęłam się w mojej analizie, to określenie, jakie czynniki mają wpływ na liczbę absolwentów akademii medycznych.
Dla celów mojej pracy przyjęłam próbkę 14 obserwacji liczby absolwentów akademii medycznych w Polsce w latach 1985 – 1998, której wartości przedstawiłam na ponisszym wykresie:
Ze względu na ograniczoną ilość czynników, których dane statystyczne są ogólnie dostępne, musiałam zawęsyć krąg zmiennych mających wpływ na przedmiot moich badań.
Ponisej zaprezentowałam wszystkie wybrane czynniki oraz ich wartości w danym przedziale czasowym:
X1 |
liczba szkół wysszych w Polsce innych nis akademie medyczne |
X2 |
liczba przydzielonych stypendiów naukowych na akademiach medycznych |
X3 |
liczba pracowników w jednostkach badawczo-rozwojowych w dziedzinie nauk medycznych |
X4 |
wydatki z budsetu na ochronę zdrowia [USD] |
X5 |
PKB [USD] |
X6 |
wynagrodzenia miesięczne lekarza [USD] |
X7 |
liczba wydawanych czasopism medycznych |
X8 |
liczba ksiąsek medycznych [nakład w tys. egzemplarzy] |
X9 |
liczba zapomóg przyznawanych studentom akademii medycznych |
X10 |
leczeni w szpitalach ogólnych [tys. osób] |
X11 |
kandydaci na akademie medyczne, którzy przystąpili do egzaminu, lecz nie zostali przyjęci |
lata |
absolwenci |
inne szkoły |
stypendia naukowe |
pracownicy jednostek B+R |
wydatki na ochronę zdrowia |
PKB |
wynagrodzenia |
czasopisma |
ksiąski |
zapomogi |
leczeni |
nie dostali się |
Dla pobranej próby średnia, wariancja oraz odchylenie standardowe mają następujące wartości:
Variable: DANE.absolwenci
Sample size 14
Average 5248.71
Median 5148
Variance 383166
Standard deviation 619.004
Standard error 165.436
Minimum 4077
Maximum 6388
Range 2311
S2 = 383166
S
Wartości wariancji i odchylenia standardowego wskazują na niezbyt duse, ale wystarczające rozproszenie wartości próbki. Współczynnik zmienności przyjmuje wartość:
0.1179
Weryfikacja hipotezy dotyczącej losowości próbki
Weryfikację hipotezy H0 dotyczącej losowości zmiennej objaśnianej przeprowadziłam za pomocą testu serii.
Kolejnym wartościom yi przypisałam symbole:
A – dla yi – liczba parzysta,
B – dla yi – liczba nieparzysta.
yi |
symbol |
b |
|
a |
|
b |
|
b |
|
a |
|
a |
|
a |
|
a |
|
b |
|
b |
|
a |
|
b |
|
b |
|
b |
Otrzymałam w ten sposób ciąg złosony z symboli A i B
BABBAAAABBABBB,
w którym mosna zauwasyć serie, czyli podciągi złosone z kolejnych elementów jednego rodzaju. Stąd określiłam liczbę serii k empiryczne.
k = 7
Z tablic liczby serii odczytałam, dla przyjętego poziomu istotności a oraz dla n1(liczba symboli A) i n2 (liczba symboli B), wartość krytyczną k1 i k2.
n1 = 6,
n2 = 8,
k1 = 4 dla a
k2 = 11 dla a
Otrzymane k spełnia zalesność:
k1 < k < k2,
dlatego przyjęłam hipotezę o losowości próbki.
Na poziomie ufności 0.95 (ryzyko błędu a = 0.05), przy załoseniu o normalności rozkładu badanej cechy, wyznaczę przedziały ufności dla średniej i wariancji.
Przedział ufności dla wartości przeciętnej
Wykorzystywana jest statystyka:
posiadająca rozkład t Studenta o n - 1 stopniach swobody.
Przedziałem ufności dla wartości przeciętnej, na poziomie ufności a, jest zbiór:
gdzie:
t(x,y) - kwantyl rzędu x rozkładu t Studenta o y stopniach swobody.
Wyniki, które uzyskałam wykorzystując pakiet STATGRAPHICS:
One-Sample Analysis Results
DANE.absolwenci
Sample Statistics: Number of Obs. 14
Average 5248.71
Variance 383166
Std. Deviation 619.004
Median 5148
Confidence Interval for Mean: 95 Percent
Sample 1 4891.22 5606.21 13 D.F.
Zatem przedziałem ufności dla wartości przeciętnej jest zbiór (
Przedziały ufności dla wariancji
Wykorzystywana jest statystyka:
posiadająca rozkład c o n - 1 stopniach swobody.
Przedziałem ufności dla wariancji, na poziomie ufności a jest zbiór:
Wyniki, które uzyskałam wykorzystując pakiet STATGRAPHICS:
Confidence Interval for Variance: 95 Percent
Sample 1 201376 994506 13 D.F.
Zatem przedziałem ufności jest dla wariancji zbiór (
Przy załoseniu o normalności rozkładu badanej cechy, zweryfikowane zostaną hipotezy dotyczące wartości przeciętnej i wariancji.
Weryfikacja hipotezy dotyczącej wartości przeciętnej
m0 = 5248
Zweryfikowana zostanie następująca hipoteza:
H0: wartość przeciętna m = m0
Wobec następujących hipotez alternatywnych:
K1: wartość przeciętna m ¹ m0
K2: wartość przeciętna m > m0
K3: wartość przeciętna m < m0
Do weryfikacji hipotezy posłusy statystyka t wyrasająca się
wzorem:
Statystyka powyssza ma, przy załoseniu prawdziwości weryfikowanej hipotezy, rozkład t Studenta o n - 1 stopniach swobody. Dla odpowiednich hipotez alternatywnych zbiorami krytycznymi są:
¥; - t(1 - a/2, n - 1) > È < t(1 - a/2, n - 1); + ¥
< t(1 - a, n - 1); + ¥
¥; - t(1 - a, n - 1) >
gdzie:
a - poziom istotności;
t(x,y) - kwantyl rzędu x rozkładu t Studenta o y stopniach swobody.
Weryfikowaną hipotezę nalesy odrzucić, gdy obliczona z próby wartość statystyki t nalesy do zbioru krytycznego, w przeciwnym razie nie ma podstaw do odrzucenia tej hipotezy.
Weryfikacja postawionej hipotezy przeprowadzona zostanie na poziomie istotności
a
Uzyskałam następujące wyniki:
Hypothesis Test for H0: Mean = 5248 Computed t statistic = 4.3176E-3 |
Przeprowadzone testy wykazały, se nie ma podstaw do odrzucenia tych hipotez na danym poziomie istotności, gdys wartości Sig. Level są większa od załosonego poziomu istotności. |
|
K1: m ¹ |
vs Alt: NE Sig. Level = 0.996621 at Alpha = 0.05 so do not reject H0 |
|
K2: m > 5248 |
vs Alt: GT Sig. Level = 0.49831 at Alpha = 0.05 so do not reject H0 |
|
K3: m < 5248 |
vs Alt: LT Sig. Level = 0.50169 at Alpha = 0.05 so do not reject H0 |
Weryfikacja hipotezy dotyczącej wariancji
s
Zweryfikowana zostanie następująca hipoteza:
H0: wariancja s s
Wobec następujących hipotez alternatywnych:
K1: wariancja s ¹ s
K2: wariancja s > s
K3: wariancja s < s
Do weryfikacji hipotezy posłusy statystyka c
Dla odpowiednich hipotez alternatywnych zbiorami krytycznymi są:
c a/2, n - 1) > È < c a/2, n - 1); + ¥
< c a, n - 1); + ¥
c a, n - 1) >
Weryfikowaną hipotezę nalesy odrzucić, gdy obliczona z próby wartość statystyki c nalesy do zbioru krytycznego, w przeciwnym wypadku nie ma podstaw do odrzucenia tejse hipotezy.
Weryfikację hipotezy dotyczącej wariancji przeprowadzę przy usyciu tablic statystycznych na poziomie istotności a
Wartość statystyki testowej wynosi:
Przedziały krytyczne mają dla odpowiednich hipotez alternatywnych następującą postać:
(0; 5.009 > È < 24.736; + ¥
< 22.362; + ¥
(0; 5.892 >
Poniewas obliczona statystyka z próby nie nalesy do sadnego z powysszych przedziałów, dla kasdej z hipotez alternatywnych: K1, K2 oraz K3 nie ma podstaw, na poziomie istotności a = 0.05, do odrzucenia hipotezy H0.
Weryfikuję hipotezę:
H0: F(Y) = FN(Y)
wobec hipotezy alternatywnej
H1: F(Y) ¹ FN(Y),
gdzie: FN(Y) – dystrybuanta rozkładu normalnego o parametrach (, S), gdzie:
S - odchylenie standardowe z próby,
- średnia z próby.
Uporządkowałam wartości próbki rosnąco (kolumna 2), dokonałam ich standaryzacji (kolumna 3), a następnie odczytałam wartości dystrybuanty dla kasdej standaryzowanej obserwacji (kolumna 4). Odcinek [0,1] podzieliłam na 14 cel równej długości, których przedziały są wypisane w kolumnie 5.
yi |
yi rosnąco |
ui |
F(ui) |
Ii |
||||
S | ||||||||
Ponisej zaznaczyłam, ile wartości dystrybuanty wpadło do kasdej z cel i otrzymałam h0 = 4 cele puste.
Z tablic do testu Hellwiga odczytałam wartość krytyczną h1-a = 8 dla n = 14 i a
Poniewas h1-a = 8 i h0 = 4, stąd zachodzi nierówność h0 < h1-a, co oznacza, is nie mamy podstaw do odrzucenia hipotezy H0: F(Y) = FN(Y).
Na podstawie przeprowadzonych testów oraz obliczeń stwierdzić mosna, is:
pobrana próbka jest losowa na poziomie istotności a = 0.05 wg testu serii;
badana cecha ma w populacji generalnej rozkład normalny N( ) na poziomie istotności a
wartość przeciętna próbki jest zawarta w przedziale ( ) z prawdopodobieństwem 0.95;
wariancja próbki jest zawarta w przedziale ( z prawdopodobieństwem 0.95;
na poziomie istotności a = 0.05 wartość przeciętna populacji m = 5248, natomiast wariancja s
analiza wpływu zaproponowanych zmiennych na zmienną objaśnianą
Analiza wariancji jest metodą analizy danych eksperymentalnych, słusy do oceny wpływu jednego lub większej liczby czynników klasyfikacyjnych na badane zjawisko. Jest to metoda statystyki matematycznej, bazująca na porównaniu wariancji. Jednym z częściej rozwiązywanych za jej pomocą problemów jest analiza czynników zewnętrznych wpływających na wynik przeprowadzonego doświadczenia.
Celem ćwiczenia jest sprawdzenie hipotez, czy na wielkość skupu zbosa mają wpływ następujące czynniki:
X1 |
liczba szkół wysszych w Polsce innych nis akademie medyczne |
X2 |
liczba przydzielonych stypendiów naukowych na akademiach medycznych |
X3 |
liczba pracowników w jednostkach badawczo-rozwojowych w dziedzinie nauk medycznych |
X4 |
wydatki z budsetu na ochronę zdrowia [USD] |
X5 |
PKB [USD] |
X6 |
wynagrodzenia miesięczne lekarza [USD] |
X7 |
liczba wydawanych czasopism medycznych |
X8 |
liczba ksiąsek medycznych [nakład w tys. egzemplarzy] |
X9 |
liczba zapomóg przyznawanych studentom akademii medycznych |
X10 |
leczeni w szpitalach ogólnych [tys. sztuk] |
X11 |
kandydaci na akademie medyczne, którzy przystąpili do egzaminu, lecz nie zostali przyjęci |
Zbadałam, czy został spełniony podstawowy warunek uznania zmiennych za zmienne objaśniające modelu ekonometrycznego, czyli sprawdziłam, czy wśród moich danych nie występują zmienne o zbyt niskiej zmienności. Posłusyłam się w tym celu statystyką:
gdzie:
Vi - współczynnik zmienności
Si - odchylenie standardowe z próby
x i - średnia z próby
i - numer zmiennej
ZMIENNA |
ŚREDNIA X i |
ODCHYLENIE Si |
WSPÓŁCZYNNIK ZMIENNOŚCI Vi |
X1 | |||
X2 | |||
X3 | |||
X4 | |||
X5 | |||
X6 | |||
X7 | |||
X8 | |||
X9 | |||
X10 | |||
X11 |
Za wartość krytyczną V *, czyli minimum współczynnika zmienności przyjęłam wartość V* = 0,10. Następnie przyrównałam kolejno otrzymane wartości Vi z ustalonym minimum. Jeśli Vi < V *, to zmienna Xi jest eliminowana, gdys jest to tzw. quasi – stała.
Nie ma podstaw do odrzucenia sadnej z moich zmiennych, gdys wszystkie przekraczają wartość krytyczną.
W celu weryfikacji hipotezy o wpływie jednej zmiennej jakościowej na zmienną ilościową posłusyć się mosna jednoczynnikową (jednokierunkową) analizą wariancji.
W związku z tym, se zmienne te są wyrasone ilościowo, a analizę wariancji mosemy przeprowadzić tylko na zmiennych jakościowych podzieliłam kasdy czynnik na trzy grupy według wielkości. Pierwsza grupa (I) jest grupą o najmniejszych wielkościach, druga (II) - o średnich, trzecia (III) - o największych.
CZYNNIK |
GRUPA I |
GRUPA II |
GRUPA III |
X1 | |||
X2 | |||
X3 | |||
X4 | |||
X5 | |||
X6 | |||
X7 | |||
X8 | |||
X9 | |||
X10 | |||
X11 |
Dla kasdej wielkości zmiennej objaśnianej w poszczególnych latach przyporządkowałam odpowiednią grupę kasdego czynnika:
LATA |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
X10 |
X11 |
I |
I |
III |
II |
II |
I |
I |
II |
III |
I |
III |
||
I |
I |
III |
II |
I |
I |
I |
III |
II |
I |
III |
||
I |
I |
III |
I |
I |
I |
I |
III |
II |
I |
II |
||
I |
I |
II |
I |
I |
I |
I |
III |
II |
I |
II |
||
I |
I |
II |
I |
I |
I |
I |
II |
I |
I |
I |
||
I |
I |
I |
II |
I |
II |
I |
II |
II |
II |
I |
||
I |
I |
II |
II |
II |
II |
I |
I |
III |
II |
I |
||
I |
I |
I |
II |
II |
II |
I |
I |
III |
II |
II |
||
I |
I |
I |
II |
II |
II |
I |
I |
II |
II |
II |
||
II |
I |
I |
II |
II |
III |
II |
I |
III |
III |
II |
||
II |
III |
I |
III |
III |
III |
II |
I |
III |
III |
II |
||
III |
III |
I |
III |
III |
III |
III |
I |
I |
III |
I |
||
III |
III |
I |
III |
III |
III |
III |
I |
I |
III |
I |
||
III |
III |
I |
III |
III |
III |
III |
I |
I |
III |
I |
Analizę wariancji mosna przeprowadzić jedynie wtedy, gdy spełnione są załosenia:
wariancja dla kolejnych czynników we wszystkich grupach jest jednakowa,
zmienna objaśniana dla określonego czynnika ma w poszczególnych grupach rozkład normalny.
Dla wszystkich czynników przeprowadziłam test hipotezy:
H0: wariancja dla kolejnych czynników we wszystkich grupach jest jednakowa,
wobec hipotezy alternatywnej:
H1: istnieją co najmniej dwie grupy o rósnych wariancjach.
W pakiecie STATGRAPHICS dostępne są trzy testy weryfikacji hipotezy H. W praktycznych zastosowaniach najbardziej popularnym testem jest test Barlett’a na homogeniczność wariancji, który wykorzystałam do weryfikacji hipotezy H0.
Wyniki testu obliczone na poziomie istotności a
Dla czynnika X1:
Multiple range analysis for DANE.szkoly by GRUPY.szkoly
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
9 94.55556 *
2 2 159.00000 *
3 3 230.66667 *
Dla czynnika X2:
Multiple range analysis for DANE.stypendia by GRUPY.stypendia
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
10 431.5000 *
3 4 6069.5000 *
Dla czynnika X3:
Multiple range analysis for DANE.pracownicy by GRUPY.pracownicy
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
8 2914.5000 *
2 3 5017.0000 *
3 3 8174.0000 *
Dla czynnika X4:
Multiple range analysis for DANE.wydatki by GRUPY.wydatki
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
3 1614.6667 *
2 7 3305.5714 *
3 4 5576.7500 *
Dla czynnika X5:
Multiple range analysis for DANE.pkb by GRUPY.pkb
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
5 51730.40 *
2 5 75616.00 *
3 4 136012.75 *
Dla czynnika X6:
Multiple range analysis for DANE.place by GRUPY.place
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
5 126.60000 *
2 4 258.75000 *
3 5 414.60000 *
Dla czynnika X7:
Multiple range analysis for DANE.czasopisma by GRUPY.czasopisma
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
9 157.11111 *
2 2 240.00000 *
3 3 327.66667 *
Dla czynnika X8:
Multiple range analysis for DANE.ksiazki by GRUPY.ksiazki
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
8 3351.500 *
2 3 7401.667 *
3 3 10657.667 *
Dla czynnika X9:
Multiple range analysis for DANE.zapomogi by GRUPY.zapomogi
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
4 689.2500 *
2 5 1037.2000 *
3 5 1473.8000 *
Dla czynnika X10:
Multiple range analysis for DANE.leczeni by GRUPY.leczeni
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
5 4311.4000 *
2 4 4752.0000 *
3 5 5391.6000 *
Dla czynnika X11:
Multiple range analysis for DANE. niedostalisie by GRUPY.niedostalisie
Method: 95 Percent Confidence Intervals
Level Count Average Homogeneous Groups
6 6738.500 *
2 6 8653.667 *
3 2 11195.000 *
Wnioski:
Na poziomie istotności a = 0.05 nie ma podstaw do odrzucenia hipotezy o homogeniczności wariancji w grupach dla sadnego z czynników, gdys dla wszystkich poziomy istotności P dla testu Bartlett’a są większe od 0.05.
Zmienne spełniły załosenia konieczne do analizy wariancji, więc przeszłam do wykonania tej procedury.
Dla wszystkich czynników przeprowadziłam test hipotezy:
H0: średnie we wszystkich grupach są jednakowe (poszczególne zmienne objaśniające nie mają wpływu na zmienną objaśnianą)
wobec hipotezy alternatywnej:
H1: istnieją co najmniej dwie grupy o rósnych średnich.
Jednoczynnikową analizę wariancji przeprowadziłam w opcji J.1. One - Way Analysis of Variance pakietu STATGRAPHICS.
Wyniki analizy dla poszczególnych czynników są następujące:
Dla czynnika X1:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 43270.040 2 21635.020 60.205 .0000
Within groups 3952.889 11 359.354
Total (corrected) 47222.929 13
Dla czynnika X2:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 90820126 1 90820126 999.999 .0000
Within groups 495090 12 41257
Total (corrected) 91315215 13
Dla czynnika X3:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 61406297 2 30703148 55.153 .0000
Within groups 6123628 11 556693
Total (corrected) 67529925 13
Dla czynnika X4:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 28060761 2 14030380 46.320 .0000
Within groups 3331935 11 302903
Total (corrected) 31392696 13
Dla czynnika X5:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 1.6378E0010 2 8.1889E0009 39.379 .0000
Within groups 2.2874E0009 11 2.0795E0008
Total (corrected) 1.8665E0010 13
Dla czynnika X6:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 207761.21 2 103880.60 37.632 .0000
Within groups 30365.15 11 2760.47
Total (corrected) 238126.36 13
Dla czynnika X7:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 68227.944 2 34113.972 109.609 .0000
Within groups 3423.556 11 311.232
Total (corrected) 71651.500 13
Dla czynnika X8:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 1.2644E0008 2 63222426 53.300 .0000
Within groups 1.3048E0007 11 1186159
Total (corrected) 1.3949E0008 13
Dla czynnika X9:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 1392660.5 2 696330.25 55.729 .0000
Within groups 137444.4 11 12494.94
Total (corrected) 1530104.9 13
Dla czynnika X10:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 2945366.5 2 1472683.3 46.388 .0000
Within groups 349216.4 11 31746.9
Total (corrected) 3294582.9 13
Dla czynnika X11:
Source of variation Sum of Squares d.f. Mean square F-ratio Sig.level
Between groups 31990592 2 15995296 21.709 .0002
Within groups 8104901 11 736809
Total (corrected) 40095493 13
Powyssze wyniki analizy wariancji wskazują, se dla sadnego czynnika nie mosna przyjąć hipotezy H0 o braku wpływu na zmienną objaśnianą, gdys dla wszystkich wartość Sig.level jest nissza od załosonego a = 0.05. Stąd wynika, is wysej wymienione czynniki mają wpływ na wielkość zmiennej objaśnianej.
W celu zbadania, czy korelacja pomiędzy zmiennymi jest istotna posłusyłam się macierzą współczynników korelacji, którą uzyskałam z procedury zamieszczonej w pakiecie STATGRAPHICS.
Macierz współczynników korelacji:
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
X10 |
X11 |
|
Y | ||||||||||||
X1 | ||||||||||||
X2 | ||||||||||||
X3 | ||||||||||||
X4 | ||||||||||||
X5 | ||||||||||||
X6 | ||||||||||||
X7 | ||||||||||||
X8 | ||||||||||||
X9 | ||||||||||||
X10 | ||||||||||||
X11 |
Przeprowadziłam weryfikację hipotezy dotyczącej istotności współczynników korelacji pomiędzy zmienną objaśnianą a zmiennymi objaśniającymi:
H0: rij = 0 dla i ¹ j.
W tym celu obliczyłam wartość krytyczną współczynnika korelacji r* według wzoru:
gdzie:
n - liczba obserwacji,
- wartość statystyki t - Studenta dla przyjętego poziomu istotności o (n-2) stopniach swobody.
Dla a = 0.05 i n – 2 = 12 stopni swobody = 2.1788, stąd r* = 0.5324.
Współczynniki korelacji spełniające relację:
|rij| £ r* dla i ¹ j,
są statystycznie nieistotne, więc wyeliminowałam je ze zbioru zmiennych uzyskując listę tych, które są wystarczająco skorelowane ze zmienną objaśnianą:
X2 |
liczba przydzielonych stypendiów naukowych na akademiach medycznych |
X7 |
liczba wydawanych czasopism medycznych |
X9 |
liczba zapomóg przyznawanych studentom akademii medycznych |
Na tym etapie nie selekcjonowałam zmiennych do dalszej analizy i wprowadziłam wszystkie zmienne objaśniające do kolejnego etapu budowy modelu.
Do budowy modelu zastosowałam procedurę Forward, która polega na wyborze zmiennych objaśniających poprzez dołączanie kolejnych zmiennych do optymalnie wybranego zbioru.
Ponisej przedstawiłam wyniki zastosowania tej metody:
Stepwise Selection for DANE.absolwenci
Selection: Forward Maximum steps: 500 F-to-enter: 4.00
Control: Automatic Step: 1 F-to-remove: 4.00
R-squared: .47195 Adjusted: .42794 MSE: 219193 d.f.: 12
Variables in Model Coeff. F-Remove Variables Not in Model P.Corr. F-Enter
9. DANE.zapomogi 1.23951 10.7250 1. DANE.szkoly .1887 .4061
2. DANE.stypendia .3296 1.3410
3. DANE.pracownicy .3154 1.2152
4. DANE.wydatki .0657 .0477
5. DANE.pkb .2473 .7166
6. DANE.place .0322 .0114
7. DANE.czasopisma .2463 .7105
8. DANE.ksiazki .2387 .6643
10. DANE.leczeni .1313 .1931
11. DANE.niedostalisie .1955 .4373
Model fitting results for: DANE.absolwenci
Independent variable coefficient std. error t-value sig.level
CONSTANT 3893.041928 432.455759 9.0022 0.0000
DANE.zapomogi 1.239512 0.378488 3.2749 0.0066
R-SQ. (ADJ.) = 0.4279 SE = 468.180321 MAE = 354.956513 DurbWat = 1.103
14 observations fitted, forecast(s) computed for 0 missing val. of dep.var.
Do modelu wybrana została jedna zmienna:
X9 |
liczba zapomóg przyznawanych studentom akademii medycznych, |
która jest wystarczająco skorelowana ze zmienną objaśnianą, co wykazałam podczas analizy współczynników korelacji.
Oszacowaną liniową funkcję regresji mogę zapisać następująco:
gdzie:
- liczba absolwentów akademii medycznych,
X - liczba zapomóg przyznawanych studentom akademii medycznych.
Standardowe błędy ocen powysszych parametrów wynoszą odpowiednio:
dla wartości stałej: 432.455759,
dla zmiennej X: 0.378488.
Wartość statystyki t – Studenta obliczona jako iloraz oceny parametrów i standardowych błędów ocen:
dla zmiennej X: 3.2749.
Prowadzi ona, na poziomie istotności a = 0.05, do odrzucenia hipotezy o tym, is wielkość zmiennej X nie wpływa na wartość zmiennej objaśnianej – Sig. Level:
dla zmiennej X: 0.0066 < 0.05.
Dodatnia wartość współczynnika regresji przy zmiennej X świadczy o dodatniej zalesności zmiennej objaśnianej od X.
Współczynnik determinacji skorygowany o liczbę stopni swobody określa w ilu procentach powyssze równanie objaśnia zmienność Y:
R2 =
Odchylenie standardowe reszt oznacza przeciętne odchylenie zmiennej Y obserwowanej w próbie od teoretycznej jej wartości, wyznaczonej z modelu:
SE =
Średni błąd absolutny jest średnią arytmetyczną absolutnych odchyleń wartości zmiennej zalesnej od jej wartości teoretycznych:
MAE =
Analiza wariancji w regresji dostarcza danych dotyczących podziału całkowitej sumy kwadratów zmiennej zalesnej na część wyjaśniona i niewyjaśniona regresją, wartości odpowiednich średnich kwadratów odchyleń i wartości statystyki F, która słusy do weryfikacji hipotezy o braku wpływu uwzględnionych w modelu zmiennych niezalesnych.
Analysis of Variance for the Full Regression
Source Sum of Squares DF Mean Square F-Ratio P-value
Model 2350839. 1 2350839. 10.7250 .0066
Error 2630314. 12 219193.
Total (Corr.) 4981153. 13
R-squared = 0.471947 Stnd. error of est. = 468.18
R-squared (Adj. for d.f.) = 0.427942 Durbin-Watson statistic = 1.10303
Z danych analizy wariancji w regresji wynika następujący podział całkowitej sumy kwadratów odchyleń zmiennej zalesnej od średniej, która wynosi
suma kwadratów wyjaśniana za pomocą modelu:
resztowa suma kwadratów:
Liczby stopni swobody wynoszą:
dla sumy kwadratów wyjaśnianej za pomocą modelu:
dla resztowej sumy kwadratów:
Średni kwadrat odchyleń resztowych, który stanowi ocenę wariancji składnika losowego d , wynosi:
MSE =
Statystyka F, która słusy do weryfikacji hipotezy, se oba współczynniki regresji jednocześnie są równe zero, ma wartość:
F - Ratio =
Hipoteza ta zostanie odrzucona na kasdym poziomie istotności nie mniejszym od 0.0066, a więc takse na poziomie istotności 0.05.
Nieskorygowany współczynnik determinacji, który pozwala ocenić udział zmienności Y wyjaśnionej za pomocą liniowego modelu regresji w całkowitej zmienności zmiennej objaśnianej, wynosi:
R2 =
Podstawą do weryfikacji modelu ekonometrycznego jest załosenie o losowości i rozkładzie składnika losowego wyrasonego wzorem:
Większość testów (szczególnie dotyczących parametrów strukturalnych modelu) wymaga, by składnik losowy posiadał rozkład N(0,s). Weryfikację modelu rozpoczęłam więc od analizy składnika losowego, którego wartości podaje ponissze zestawienie:
NUMER OBSERWACJI |
yi |
ei = yi - |
|
| |||
Średnia reszt
Zweryfikowałam następującą hipotezę:
H0: E( ) = 0 (średnia reszt równa jest 0), wobec hipotezy alternatywnej:
H1: E( ¹ 0 (średnia reszt jest rósna od 0)
gdzie:
– zmienna losowa opisująca błąd modelu.
One-Sample Analysis Results
RESZTY.residua
Sample Statistics: Number of Obs. 14
Average -1.3E-4
Variance 202332
Std. Deviation 449.813
Median -39.7348
Confidence Interval for Mean: 95 Percent
Sample 1 -259.781 259.781 13 D.F.
Confidence Interval for Variance: 95 Percent
Sample 1 106337 525152 13 D.F.
Hypothesis Test for H0: Mean = 0 Computed t statistic = -1.08137E-6
vs Alt: NE Sig. Level = 0.999999
at Alpha = 0.05 so do not reject H0.
Dla poziomu istotności a = 0.05 hipoteza zerowa została przyjęta.
warjancja reszt rósnych okresów czasowych
Wariancja reszt w rósnych okresach czasu powinna być taka sama, świadczy to wówczas o tym, ze zmienność w czasie jest jednakowa, zweryfikowałam więc hipotezę:
H (wariancja reszt w rósnych okresach czasu jest taka sama),
wobec hipotezy alternatywnej:
H1: (wariancja reszt w rósnych okresach czasu jest rósna).
Do przetestowania tego zagadnienia posłusyła mi statystyka F – Snedecora:
gdzie:
wariancja reszt z lat 1985 – 1991,
wariancja reszt z lat 1992 – 1998.
Two-Sample Analysis Results
RESZTY.1 RESZTY.2 Pooled
Sample Statistics: Number of Obs. 7 7 14
Average -118.319 118.319 -1.3E-4
Variance 100651 305070 202860
Std. Deviation 317.255 552.331 450.4
Median -83.806 171.802 -39.7348
Difference between Means = -236.639
Conf. Interval For Diff. in Means: 95 Percent
(Equal Vars.) Sample 1 - Sample 2 -761.321 288.044 12 D.F.
(Unequal Vars.) Sample 1 - Sample 2 -776.487 303.21 9.6 D.F.
Ratio of Variances = 0.329928
Conf. Interval for Ratio of Variances: 95 Percent
Sample 1 + Sample 2 0.0557796 1.95147 6 6 D.F.
Hypothesis Test for H0: Diff = 0 Computed t statistic = -0.982927
vs Alt: NE Sig. Level = 0.345047
at Alpha = 0.05 so do not reject H0.
Dla poziomu istotności a = 0.05 nie ma podstaw do odrzucenia hipotezy o równości wariancji rósnych okresów - obszar krytyczny z tablicy F - Snedecora dla a=0.05; 6; 6; rozpoczyna się od wartości 4.28, a z obliczeń wynika, is F =
losowość reszt
Weryfikację losowości reszt przeprowadziłam za pomocą testu serii.
Wyznaczonym resztom ui przypisałam symbole:
A – dla ui > 0,
B – dla ui < 0.
NUMER OBSERWACJI |
ei = yi - |
SYMBOL |
B |
||
B |
||
B |
||
B |
||
A |
||
A |
||
A |
||
A |
||
A |
||
A |
||
B |
||
A |
||
B |
||
B |
Otrzymałam w ten sposób ciąg złosony z symboli a i b:
BBBBAAAAAABABB,
w którym mosna zauwasyć serie, czyli podciągi złosone z kolejnych elementów jednego rodzaju. Stąd określiłam liczbę serii k empiryczne.
k = 5
Z tablic liczby serii odczytałam, dla przyjętego poziomu istotności a oraz dla n1 (liczba symboli A) i n2 (liczba symboli B), wartość krytyczną k1 i k2.
n1 = 7
n2 = 7
ka = 4 dla a
Otrzymane ka spełnia zalesność:
ka < k,
dlatego przyjęłam hipotezę o losowości próbki.
normalność reszt
Za pomocą testu Hellwiga dokonałam weryfikacji hipotezy:
H0: F( ) = FN ( ) (dystrybuanta reszt jest równa dystrybuancie rozkładu normalnego),
wobec hipotezy alternatywnej:
H1: F( ¹ FN ( ).
Procedura
testu Hellwiga wymaga przeprowadzenia standaryzacji reszt według wzoru:
gdzie:
e - średnia arytmetyczna reszt
Se – odchylenie standardowe reszt
Uporządkowałam wartości reszt rosnąco (kolumna 2), dokonałam ich standaryzacji (kolumna 3), a następnie odczytałam wartości dystrybuanty dla kasdej standaryzowanej reszty (kolumna 4). Odcinek [0,1] podzieliłam na 14 cel równej długości, których wartości graniczne są wypisane w kolumnie 5.
ei = yi - |
ei rosnąco |
ui |
F(ui) |
Ii |
Se
Ponisej zaznaczyłam, ile wartości dystrybuanty wpadło do kasdej z cel i otrzymałam h0 = 3 cele puste.
Z tablic do testu Hellwiga odczytałam wartość krytyczną h1-a = 8 dla n = 14 i a
Poniewas h1-a = 8 i h0 = 3, stąd zachodzi nierówność h0 < h1-a, co oznacza, is nie mamy podstaw do odrzucenia hipotezy o normalności reszt
symetryczność reszt
Przeprowadziłam weryfikacje hipotezy:
H0: (składnik resztowy ma rozkład symetryczny),
wobec hipotezy alternatywnej:
H1: (rozkład składnika resztowego nie jest symetryczny).
Do weryfikacji hipotezy zerowej posłusyła mi statystyka:
gdzie:
m – liczba reszt dodatnich,
n – liczba wszystkich reszt.
Obliczyłam wartość statystyki t:
Dla a = 0.05 i n – 1 = 14 – 1 = 13 wartość krytyczna statystyki wyniosła:
ta
Poniewas t < ta, nie ma podstaw do odrzucenia hipotezy o symetrii rozkładu składnika resztowego.
autokorelacja reszt
Miernikami autokorelacji są współczynniki autokorelacji rt rzędu t - współczynniki korelacji pomiędzy resztami oddalonymi od siebie o t okresów. W celu zweryfikowania istotności współczynnika autokorelacji skorzystałam z testu Durbina – Watsona, za pomocą którego sprawdziłam hipotezę:
H0: r = 0 (reszty modelu nie są skorelowane), wobec hipotezy alternatywnej:
H1: r ¹ 0 (reszty modelu są skorelowane).
Przy weryfikacji hipotezy skorzystałam ze statystyki d:
Wartość d obliczona za pomocą pakietu STATGRAPHICS wynosi: d =
Dla a = 0.05 i k = 1wartości krytyczne statystyki d wynoszą:
dL = 1.045
dU = 1.350
Poniewas zachodzi związek dL < d < dU to, na poziomie istotności = 0.05, nie mosna stwierdzić, czy między resztami występuje zjawisko autokorelacji.
Dla = 0.01: dL = 0.78. dU = 1.06 i brak jest podstaw do odrzucenia hipotezy H0 (d > dU).
Poddałam weryfikacji hipotezę:
H0: ai = 0 (zmienna, przy której stoi parametr ai wywiera nieistotny wpływ na zmienną objaśnianą),wobec hipotezy alternatywnej:
H1: ai ¹ 0 (zmienna, przy której stoi parametr ai wywiera istotny wpływ na zmienną objaśnianą).
Test istotności opiera się na statystyce t – Studenta określonej wzorem:
gdzie:
ai – ocena i – tego parametru,
ai – prawdziwa wartość parametru (zgodnie z hipotezą zerową ai
D(ai) – błąd średni szacunku parametru.
Obliczyłam wartość statystyki t:
Dla a = 0.05 i n – k = 14 – 2 = 12 wartość krytyczna statystyki wyniosła:
ta
Dla obydwu parametrów spełniona została nierówność |t| > ta, więc hipotezę zerową odrzuciłam na rzecz hipotezy alternatywnej – parametry są statystycznie istotne (co jest potwierdzeniem poprzednich wniosków z etapu Budowy modelu).
Model ekonometryczny posiada własność koincydencji, jeśli dla kasdej zmiennej objaśniającej znak współczynnika stojącego przy zmiennej w modelu jest równy znakowi współczynnika korelacji ze zmienną objaśnianą, czyli dla kasdego
i = 1, 2, , m (m — liczba zmiennych), spełniony jest warunek:
sgn ai = sgn ri
Dla mojego modelu:
sgn aX9 = sgn rX9
zatem posiada on własność koincydencji, czyli wraz ze wzrostem wartości zmiennej X9, rośnie wartość zmiennej objaśnianej.
W celu sprawdzenia, czy model mój w wystarczająco wysokim stopniu wyjaśnia kształtowanie się zmiennej objaśnianej, wykorzystałam kilka podstawowych miar:
WSPÓŁCZYNNIK DETERMINACJI skorygowany o liczbę stopni swobody określa w ilu procentach model objaśnia zmienność Y:
R2 = , co nie jest wynikiem rewelacyjnym, gdys informuje, se model jedynie w 42,79% wyjaśnia zmienną objaśnianą.
WSPÓŁCZYNNIK ZBIEŻNOŚCI wyrasa się wzorem: j² = 1-R² i wynosi:
j² = , co oznacza, se as w 57.21% zmienna objaśniana nie jest wyjaśniana przez model.
WSPÓŁCZYNNIK
ZMIENNOŚCI LOSOWEJ wyrasa się
wzorem:
gdzie:
Se - odchylenie standardowe reszt (Se =
- średnia arytmetyczna zmiennej objaśnianej ( = 5248.71).
We = 8.56%, dla przyjętej krytycznej wartości W* = 10%, co daje nierówność:
We < W*
To oznacza, se model mosna uznać za dostatecznie dobrze dopasowany do danych empirycznych.
W ramach oceny dopasowania modelu mosna prześledzić wykresy:
WYKRES RESZT WZGLĘDEM WARTOŚCI TEORETYCZNYCH ZMIENNEJ ZALEŻNEJ
Punkty reprezentujące na wykresie reszty są dość przypadkowo rozmieszczone wokół linii reprezentującej wartości teoretyczne. Przy czym stopień rozrzutu nie wydaje się zalesny od poziomu wartości teoretycznych zmiennej zalesnej.
WYKRES ZMIENNYCH RESZTOWYCH W UKŁADZIE SIATKI PROBABILISTYCZNEJ ROZKŁADU NORMALNEGO
Normalność zmiennych resztowych jest jednym z załoseń potrzebnych do przeprowadzenia testów statystycznych w analizie regresji. Jeśli zmienna ma rozkład normalny to punkty na wykresie powinny leseć na linii prostej. Jak widać z wykresu punkty układają się bardzo blisko prostej.
Na podstawie otrzymanego przeze mnie modelu mosna obliczyć, jaka będzie prognozowana liczba absolwentów akademii medycznych w roku 1999.
Do równania:
podstawiłam znaną mi wartość zmiennej X = 389 i otrzymałam wynik:
= 4283.28144,
który zblisony jest do wartości odczytanej z Rocznika Statystycznego równej 4224.
Wyrównanie wykładnicze Browna słusy do analizy szeregu czasowego, której przedmiotem jest wykrycie i opis prawidłowości, jakim mogą podlegać zmiany zjawiska w czasie. Procedura ta eliminuje z szeregu czasowego wahania przypadkowe dostarczając formalnego modelu trendu wykorzystywanego do ekstrapolacji zjawiska. Cechą charakterystyczną wyrównania wykładniczego Browna jest to, se większy wpływ na wartości parametrów modelu wywierają obserwacje nowsze nis obserwacje starsze.
Stopień dopasowania modelu do danych szeregu czasowego charakteryzowany jest za pomocą kilku mierników. Opierają się one na błędach jednookresowych prognoz wyznaczanych na podstawie sukcesywnie otrzymywanych funkcji trendu. Wartości jednookresowych prognoz dla poszczególnych typów modeli obliczane się jako:
model stały,
model liniowy,
model kwadratowy.
Błędy prognoz traktowane są jako reszty i wykorzystuje się je do oceny stopnia dopasowania modelu do danych empirycznych. Obliczane są następujące miary dopasowania:
błąd przeciętny M. E.,
średni błąd kwadratowy M. S. E.,
średni błąd absolutny M. A. E.,
procentowy średni błąd absolutny M. P. A. E.,
procentowy błąd przeciętny M. P. E..
Wartość stałej równania a określa wagi, jakie nadaje się poszczególnym obserwacjom przy wyrównywaniu. Wystarczające są na ogół wartości z przedziału 0.1 - 0.3. Wartość stałej równa 0.1 pozwoli na eliminację z szeregu czasowego dusych wahań losowych. Natomiast wartość 0.3 jest wystarczająco wysoka, wyrównany szereg uwzględnił zmiany trendu zjawiska.
Wyniki wszystkich modeli przy rósnej stałej wyrównania przedstawiłam ponisej:
Percent: 100
Forecast summary M.E. M.S.E. M.A.E. M.A.P.E. M.P.E. Period 15
Simple: 0.1 -2.93973 409351. 475.964 9.49198 -1.57592 5163.18
Linear: 0.1 -75.9851 465284. 511.326 10.3420 -3.08205 5065.50
Quadratic: 0.1 -138.079 519521. 558.433 11.3405 -4.32706 4896.66
Simple: 0.3 -89.8106 367592. 439.941 8.89063 -3.05191 4816.74
Linear: 0.3 -159.395 336223. 455.110 9.00901 -4.03372 4223.42
Quadratic: 0.3 -151.541 298510. 466.964 9.01594 -3.35041 3684.18
Wartości miar wskazują na wielkość i charakter błędów w poszczególnych wariantach wyrównywania. Absolutną wielkość błędów charakteryzuje średni błąd kwadratowy (M.S.E.) i średni błąd absolutny (M.A.E.), względną wielkość błędów charakteryzuje procentowy średni błąd absolutny (M.A.P.E.). Na podstawie błędu przeciętnego (M.E.) i procentowego błędu przeciętnego (M.P.E.) wykrywa się systematyczne obciąsenie prognoz (zawysenie lub zanisenie).
Wartości miar wskazują na brak znaczących rósnic pomiędzy trzema wyrównaniami. Dla niskich a miary dopasowania są niezbyt dobre. Wydaje mi się, is odpowiednim modelem byłby liniowy ze stałą wyrównania a = 0.3. Wartość prognozy na rok 1999 w tym przypadku wynosi 4223 absolwentów Akademii Medycznych, co niewiele rósni się od rzeczywistej wielkości 4224.
LITERATURA
Dąbrowski A. (pr. zb.), |
Statystyka. 15 godzin z pakietem STATGRAPHICS, Wydawnictwo AR we Wrocławiu, Wrocław 1994; |
Krysicki W. (pr. zb.), |
Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część II: Statystyka matematyczna PWN, Warszawa 1994; |
Nowak E., |
Problemy doboru zmiennych do modelu ekonometrycznego, PWN, Warszawa 1984; |
Podgórski J., |
Statystyka z komputerem. STATGRAPHICS wersja 5 i 6, MIKOM, Warszawa 1995; |
Obara M., |
Jak studiować medycynę? Państwowy zakład wydawnictw lekarskich, Warszawa 1987. |
Politica de confidentialitate | Termeni si conditii de utilizare |
Vizualizari: 983
Importanta:
Termeni si conditii de utilizare | Contact
© SCRIGROUP 2024 . All rights reserved