Gepubliceerd op 17 december 2020 door FBSB. Bijgewerkt op 8 augustus 2022.

De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.



Inhoudsopgave Hypothesen toetsen met de p-waarde Eenzijdig of tweezijdig toetsen en het verwerpingsgebied Wanneer gebruik je de p-waarde? P-waarde interpreteren in SPSS en Excel Foute interpretaties van de p-waarde Veelgestelde vragen

Hypothesen toetsen met de p-waarde

Voordat je de p-waarde kunt bepalen, moet je bepalen welke aanname je wilt verwerpen. Deze aanname heet de nulhypothese. De nulhypothese kan bijvoorbeeld zijn dat de gemiddelde lengte van Nederlandse mannen 181 cm is, of dat een coëfficiënt in een regressie 0 is. Bovendien kies je een significantieniveau 𝛼, meestal is dat 0.05.

Tegenover de nulhypothese staat de alternatieve hypothese. Wanneer je de nulhypothese kunt verwerpen, is de alternatieve hypothese de conclusie die je trekt. De p-waarde is gedefinieerd als de kans dat in de verdeling die volgt uit de nulhypothese, de waarde van de steekproefuitkomst wordt behaald of overschreden. Als deze kans klein genoeg is (kleiner dan het significantieniveau), is de uitkomst extreem en kun je de nulhypothese verwerpen.

Een melkfabrikant produceert pakken melk met een inhoud van 1000 ml en wil verifiëren of een machine de pakken daadwerkelijk met 1000 ml vult. Hij besluit daarom een steekproef te nemen. Als het steekproefgemiddelde te ver afwijkt van 1000ml zal hij concluderen dat de machine anders afgesteld moet worden. Dit is het geval als de p-waarde kleiner is dan het significantieniveau.

Eenzijdig of tweezijdig toetsen en het verwerpingsgebied

Wanneer je eenzijdig toetst, ga je uit van een bestaand verschil, bijvoorbeeld dat Nederlandse mannen gemiddeld langer dan 181 cm zijn. Omdat je uitgaat van een positief verschil toets je rechtszijdig. Je verwerpt de nulhypothese als de steekproefuitkomst extreem hoog is. Als je wil testen of Nederlandse mannen gemiddeld korter dan 181cm zijn, toets je linkszijdig.

Toets je tweezijdig, dan verwerp je de nulhypothese als de steekproefuitkomst erg hoog of erg laag is. Het verwerpingsgebied bestaat dan uit twee delen en is dus twee keer zo hoog als wanneer je eenzijdig toetst.

Wanneer gebruik je de p-waarde?

De p-waarde komt van pas bij iedere statistische toets, zoals bijvoorbeeld de t-toets. De p-waarde wordt daarnaast veel gebruikt bij het doen van regressieanalyses. De p-waarde komt ook goed van pas bij het beantwoorden van kleine, praktische onderzoeksvragen.

P-waarde interpreteren in SPSS en Excel

Omdat de p-waarde in veel verschillende situaties gebruikt kan worden, is er geen standaard stappenplan voor het bepalen van de p-waarde. Het interpreteren ervan is echter wel in iedere situatie hetzelfde. Hieronder bespreken we twee voorbeelden, aan de hand van output in SPSS en Excel.

SPSS

Excel In SPSS kun je eenvoudig toetsen of het waarschijnlijk is dat het gemiddelde van een set gegevens gelijk is aan een bepaalde waarde. In de tabellen hieronder zie je de output van een t-toets. Er wordt onderzocht of de lengte van Nederlandse mannen 181 cm is. De eerste tabel geeft de beschrijvende statistieken. Zo zie je dat er 1000 waarnemingen zijn en dat de gemiddelde lengte 180,47 cm is. In de tweede tabel volgt het resultaat van de toets. In de kolom “Sig. (2-tailed)” zien we de p-waarde die hoort bij een tweezijdige toets. Als we uitgaan van een significantieniveau van 0.05 is er geen aanleiding om de nulhypothese te verwerpen, want 0.147 > 0.05. Op basis van deze toets is het dus waarschijnlijk dat de gemiddelde lengte van Nederlandse mannen 181 cm is. In SPSS moet je altijd opletten wanneer je eenzijdig wilt toetsen. In dat geval moet je de waarde in de kolom “Sig. (2-tailed)” halveren voordat je gaat vergelijken met je significantieniveau. Wanneer de t-waarde positief is, toets je rechtszijdig. Is de t-waarde negatief? Dan toets je linkszijdig. Ook in Excel kun je veel verschillende toetsen doen. In de tabel hieronder zie je de output van een t-toets, waarin getoetst wordt of het verschil in lengte tussen Nederlandse mannen en vrouwen gelijk is aan 11,5 centimeter.In tegenstelling tot SPSS, geeft Excel zoals je kunt zien wel de p-waarde voor zowel eenzijdige als tweezijdige toetsen. We kiezen wederom een significantieniveau van 0.05 kiezen.Bij een tweezijdige toets (het verschil is ongelijk aan 11,5 cm) kunnen we de nulhypothese niet verwerpen, want 0.076 > 0.05.Bij een eenzijdige toets (het verschil is groter dan 11,5 cm) kunnen we de nulhypothese wel verwerpen (want 0.038 < 0.05). Omdat de t-waarde positief is, toetsen we rechtszijdig. .

See Also The p-value and rejecting the null (for one- and two-tail tests) — Krista King Math | Online math help

Foute interpretaties van de p-waarde

P-waarden worden vaak verkeerd gebruikt of geïnterpreteerd. Hieronder vind je een aantal veel voorkomende misvattingen.

Als de p-waarde kleiner is dan het significantieniveau (bijvoorbeeld 0.02 bij een significantieniveau van 0.05):

Er is bewijs gevonden dat de nulhypothese verworpen kan worden.

Bewijs is er niet gevonden, wel is er voldoende aanleiding gevonden om de nulhypothese in twijfel te trekken.

verworpen kan worden. Bewijs is er niet gevonden, wel is er voldoende aanleiding gevonden om de nulhypothese in twijfel te trekken. De kans dat de nulhypothese klopt is 0.02.

0.02 is de kans op de steekproefuitkomst gegeven de nulhypothese, niet andersom.

0.02 is de kans op de steekproefuitkomst gegeven de nulhypothese, niet andersom. De p-waarde van de kans dat de nulhypothese onterecht verworpen wordt, is 0.02 (= 1 – 0.98).

De nulhypothese is simpelweg waar of niet waar, je berekent geen kans die betrekking heeft op de nulhypothese (zie het voorbeeld hierboven).

Als de p-waarde groter is dan het significantieniveau:

Er is voldoende aanleiding om aan te nemen dat de nulhypothese klopt.

Je kunt alleen laten zien dat de steekproefuitkomst wel/niet extreem is gegeven de nulhypothese. Is de uitkomst te extreem, dan concludeer je dat de alternatieve hypothese logischer is. Je vindt echter nooit aanleiding om de nulhypothese te concluderen.

Veelgestelde vragen

Wat is statistische significantie? Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans). Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is. Een andere drempel die vaak wordt gekozen isp< 0.01. Als de p-waarde lager is dan de gekozen alfa-waarde, mag je stellen dat het resultaat van de toets statistisch significant is. Wat is een p-waarde (p-value)? De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen. Wat zijn een nulhypothese en alternatieve hypothese? Bij statistische analyses voorspelt de nulhypothese (H 0 ) altijd dat er geen effect of relatie tussen variabelen is, terwijl de alternatieve hypothese (H 1 ) je verwachting van een effect of relatie uitdrukt.