T-toetsstatistieken van de student

Student's t-test, in statistiek, een methode om hypothesen te testen over het gemiddelde van een kleine steekproef uit een normaal verdeelde populatie wanneer de standaarddeviatie van de populatie onbekend is.

In 1908 ontwikkelde William Sealy Gosset, een Engelsman die onder het pseudoniem Student publiceerde, de t-test en t-distributie. De t-verdeling is een familie van curven waarin het aantal vrijheidsgraden (het aantal onafhankelijke waarnemingen in de steekproef min één) een bepaalde curve specificeert. Naarmate de steekproefomvang (en dus de vrijheidsgraden) toeneemt, nadert de t-verdeling de klokvorm van de standaard normale verdeling. In de praktijk wordt voor tests waarbij het gemiddelde van een monster met een grootte groter dan 30 wordt genomen, gewoonlijk de normale verdeling toegepast.

Het is gebruikelijk om eerst een nulhypothese te formuleren, die stelt dat er geen effectief verschil is tussen het waargenomen steekproefgemiddelde en het veronderstelde of vermelde populatiegemiddelde - dat wil zeggen dat elk gemeten verschil alleen het gevolg is van toeval. In een landbouwstudie zou de nulhypothese bijvoorbeeld kunnen zijn dat het toedienen van kunstmest geen effect heeft gehad op de gewasopbrengst en zou er een experiment worden uitgevoerd om te testen of het de oogst heeft vergroot. Over het algemeen kan een t-test tweezijdig zijn (ook wel tweezijdig genoemd), simpelweg door te zeggen dat de middelen niet equivalent zijn, of eenzijdig, waarbij wordt gespecificeerd of het waargenomen gemiddelde groter of kleiner is dan het veronderstelde gemiddelde. Vervolgens wordt de teststatistiek t berekend. Als de waargenomen t-statistiek extremer is dan de kritische waarde bepaald door de juiste referentieverdeling, wordt de nulhypothese verworpen. De geschikte referentieverdeling voor de t-statistiek is de t-verdeling. De kritische waarde hangt af van het significantieniveau van de test (de waarschijnlijkheid dat de nulhypothese ten onrechte wordt afgewezen).

Stel dat een onderzoeker bijvoorbeeld de hypothese wil testen dat een steekproef van grootte n = 25 met gemiddelde x = 79 en standaarddeviatie s = 10 willekeurig is getrokken uit een populatie met gemiddelde μ = 75 en onbekende standaarddeviatie. Gebruikmakend van de formule voor de t-statistiek, is de berekende t gelijk aan 2. Voor een tweezijdige test op een gemeenschappelijk significantieniveau α = 0.05 zijn de kritische waarden van de t-verdeling op 24 vrijheidsgraden −2.064 en 2.064. De berekende t overschrijdt deze waarden niet, daarom kan de nulhypothese niet met 95 procent zekerheid worden verworpen. (Het betrouwbaarheidsniveau is 1 - α.)

Een tweede toepassing van de t-verdeling test de hypothese dat twee onafhankelijke willekeurige steekproeven hetzelfde gemiddelde hebben. De t-verdeling kan ook worden gebruikt om betrouwbaarheidsintervallen te construeren voor het werkelijke gemiddelde van een populatie (de eerste toepassing) of voor het verschil tussen twee steekproefgemiddelden (de tweede toepassing). Zie ook intervalschatting.