Mając próbę, dokonujemy w niej pomiarów badanej cechy...

Jak cię złapią, to znaczy, że oszukiwałeś. Jak nie, to znaczy, że posłużyłeś się odpowiednią taktyką.
Następnie obliczamy interesujące wskaźniki opisu statystycznego. Gdy są już znane, wówczas można sformułować hipotezy dotyczące własności cechy w całej populacji. Hipotezy tego rodzaju, nazywane statystycznymi, dzielimy na trzy typy:
a. Hipotezy istotności różnic, wśród których wyróżniamy dwa rodzaje:
- w pierwszym wartość wskaźnika charakteryzującego populację porównuje się
z wartością wzorcową, np. wiadomo z dawniejszych badań, że na 100 mężczyzn
100
przypada 108 kobiet, tzn. częstość kategorii mężczyzn jest równa ; wykona-
208
wszy nowe badania, będziemy się starali zweryfikować hipotezę, że częstość się nie
zmieniła i nadal równa jest ;
208
- w drugim porównuje się wskaźniki tej samej cechy w dwóch populacjach;
przykładem hipoteza, że wynik średni kobiet w teście inteligencji jest taki sam, jak
wynik średni mężczyzn.
b. Hipotezy niezależności. Badamy współzależność dwóch cech i chcemy roz
strzygnąć, czy ta współzależność istnieje. Typowe sformułowanie takiej hipotezy
wygląda następująco: wartość wskaźnika współzależności dwóch danych cech
w populacji jest równa O (to znaczy, że nie ma żadnej współzależności).
c. Hipotezy zgodności. Wiążą się z porównywaniem tzw. rozkładów cech. Roz
kładem cechy jakościowej mającej k kategorii nazywamy ciąg Cj, C2, C3, ..., Ck
częstości występowania tych kategorii. Mówimy, że dwie cechy jakościowe mają
jednakowe rozkłady, jeśli ich ciągi częstości są takie same.
Precyzyjne określenie rozkładu cechy ilościowej jest skomplikowane matematycznie, dlatego ograniczymy się do podania ogólnego schematu tego pojęcia. Przez rozkład cechy ilościowej można rozumieć przyporządkowanie każdemu podzbiorowi skali pomiarowej prawdopodobieństwa tego, iż wynik pomiaru znajdzie się w tym podzbiorze. Z reguły rozkład dany jest przez tzw. gęstość rozkładu, będącą pewną funkcją rzeczywistą. Podany niżej przykład wyjaśni istotę sprawy.
Rozkład normalny - jest jednym z najczęściej spotykanych rozkładów cech. Jego gęstość ma charakterystyczny wykres:
Prawdopodobieństwo zdarzenia, że wartość wyniku pomiaru cechy znajdzie się w odcinku (a, b), jest równe polu obszaru między wykresem gęstości i odcinkiem
109
(a, b) - część zakreskowana na rysunku. Widać, że rozkład normalny charakteryzuje się tym, iż istnieje pewna wartość \L (wartość oczekiwana), wokół której gromadzić się powinny prawie wszystkie wyniki. Widać również, że prawdopodobieństwo znalezienia się daleko od wartości oczekiwanej jest niezwykle małe.
Typowa hipoteza zgodności brzmi następująco: rozkład cechy X w populacjach A i B jest taki sarn (oczywiście w każdym przypadku w miejsce X, A i B wstawiamy konkretne nazwy).
Hipotezę sformułowaną według jednego z powyższych schematów, zawierającą syntezę naszej wiedzy o badanych populacjach, nazywamy hipotezą zerową i oznaczamy H0. Hipotezę będącą jej zaprzeczeniem, czyli hipotezę alternatywną, oznaczamy przez H,. Z reguły dla każdej hipotezy zerowej istnieje wiele hipotez alternatywnych.
Może się zdarzyć, że hipoteza zerowa jest prawdziwa, a my odrzucimy ją i uznamy za prawdziwą H,. Popełnimy wówczas szczególnie niebezpieczny błąd, który nazywamy błędem pierwszego rodzaju. Prawdopodobieństwo jego wystąpienia oznaczamy literą a i nazywamy poziomem istotności. Zwyczajowo w badaniach przyrodniczych przyjmuje się a = 0,05, czasami przy wyjątkowo dokładnych badaniach można sobie pozwolić na a = 0,01. Błąd drugiego rodzaju popełniamy przyjmując za prawdziwą hipotezę H0, która w rzeczywistości będzie fałszywa.
Mając sformułowaną hipotezę zerową i ustalony poziom istotności a, przechodzimy do ostatniego etapu procedury wnioskowania statystycznego, to jest do weryfikacji hipotezy. Służą do tego testy statystyczne, odpowiednio dobrane do typu hipotezy i sytuacji, którą ona opisuje.
SCHEMAT DZIAŁANIA TESTÓW STATYSTYCZNYCH
Jednym z podstawowych elementów testu jest liczba zwana funkcją testu, którą obliczamy według odpowiedniego wzoru. Występują w nim z reguły dane charakteryzujące wyniki pomiaru badanej cechy w próbie (wskaźniki statystyczne, liczebno-
S2
l 2
ści prób). Na przykład w teście Fishera funkcja testu ma postać F = -, gdzie Sj
s2
2 2
i S2 są uporządkowanymi wariancjami cechy, otrzymanymi z dwóch prób. Wzory wyrażające funkcję innych testów są z reguły bardziej skomplikowane, obliczenia nie przekraczają jednak zakresu czterech działań arytmetycznych i pierwiastkowania.
110
Drugim podstawowym elementem testu jest liczba zwana wartością krytyczną. Liczba ta z reguły zależy od poziomu istotności a, od liczebności próby (prób), od ilości kategorii cechy jakościowej. Znajdujemy ją w tablicach wartości krytycznych. Na ogół każdy test ma swoją własną, unikatową tablicę, ale zdarzają się tablice wspólne dla kilku testów.
Porównujemy teraz funkcję testu z wartością krytyczną. Jeżeli wartość funkcji jest większa (lub równa dla niektórych testów) od wartości krytycznej, to hipotezę zerową musimy odrzucić. W przeciwnym wypadku nie ma podstaw do jej odrzucenia. Należy podkreślić, że odrzucenie hipotezy zerowej nie jest równoznaczne ze stwierdzeniem jej fałszywości, z obaleniem jej. Uzyskujemy tylko pewne oszacowanie stopnia jej wiarygodności, stwierdzamy mianowicie, że w danym przypadku szansa na jej prawdziwość jest niewielka.
Na koniec jeszcze uwaga o sposobie korzystania z tablic. Umieszczone w nich wartości krytyczne zależą zawsze od pewnych parametrów. Często jednak zdarza się, że w tablicy nie ma liczb odpowiadających naszemu aktualnemu parametrowi. Wówczas należy wybrać z tablicy dwie liczby odpowiadające wartościom parametrów najbliższych naszemu i użyć ich średniej arytmetycznej jako odpowiedniej wartości krytycznej.
PRZYKŁADY TESTÓW STATYSTYCZNYCH
Test Studenta (dla prób niezależnych)
WÄ…tki
Powered by wordpress | Theme: simpletex | © Jak ciÄ™ zĹ‚apiÄ…, to znaczy, ĹĽe oszukiwaĹ‚eĹ›. Jak nie, to znaczy, ĹĽe posĹ‚uĹĽyĹ‚eĹ› siÄ™ odpowiedniÄ… taktykÄ….