Bij statistische analyses voorspelt de nulhypothese (H 0 ) altijd dat er geen effect of relatie tussen variabelen is, terwijl de alternatieve hypothese (H 1 ) je verwachting van een effect of relatie uitdrukt.

De p-waarde (p-value) is een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is. Wanneer de p-waarde kleiner is dan het gekozen significantieniveau kun je stellen dat dat de gevonden uitkomst extreem genoeg is om je nulhypothese te verwerpen.

Als de p-waarde lager is dan de gekozen alfa-waarde, mag je stellen dat het resultaat van de toets statistisch significant is.

Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de nulhypothese waar is. Een andere drempel die vaak wordt gekozen isp< 0.01.

Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans).

Omdat de p-waarde in veel verschillende situaties gebruikt kan worden, is er geen standaard stappenplan voor het bepalen van de p-waarde. Het interpreteren ervan is echter wel in iedere situatie hetzelfde. Hieronder bespreken we twee voorbeelden, aan de hand van output in SPSS en Excel.

Toets je tweezijdig, dan verwerp je de nulhypothese als de steekproefuitkomst erg hoog of erg laag is. Het verwerpingsgebied bestaat dan uit twee delen en is dus twee keer zo hoog als wanneer je eenzijdig toetst.

Wanneer je eenzijdig toetst, ga je uit van een bestaand verschil, bijvoorbeeld dat Nederlandse mannen gemiddeld langer dan 181 cm zijn. Omdat je uitgaat van een positief verschil toets je rechtszijdig. Je verwerpt de nulhypothese als de steekproefuitkomst extreem hoog is. Als je wil testen of Nederlandse mannen gemiddeld korter dan 181cm zijn, toets je linkszijdig.

Tegenover de nulhypothese staat de alternatieve hypothese. Wanneer je de nulhypothese kunt verwerpen, is de alternatieve hypothese de conclusie die je trekt. De p-waarde is gedefinieerd als de kans dat in de verdeling die volgt uit de nulhypothese, de waarde van de steekproefuitkomst wordt behaald of overschreden. Als deze kans klein genoeg is (kleiner dan het significantieniveau), is de uitkomst extreem en kun je de nulhypothese verwerpen.

Voordat je de p-waarde kunt bepalen, moet je bepalen welke aanname je wilt verwerpen. Deze aanname heet de nulhypothese. De nulhypothese kan bijvoorbeeld zijn dat de gemiddelde lengte van Nederlandse mannen 181 cm is, of dat een coëfficiënt in een regressie 0 is. Bovendien kies je een significantieniveau 𝛼, meestal is dat 0.05.

De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is. Hoe kleiner de p-waarde, hoe extremer de uitkomst. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een significante, resp.

Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men 'statistisch significant'. Als een resultaat statistisch significant is, hoeft dit niet automatisch in te houden dat het ook van klinisch belang is.

Dit komt doordat een p-waarde per definitie nooit groter kan zijn dan 1! In het Nederlands gebruik je een komma (bijvoorbeeld p < 0,01). SPSS geeft nog wel eens p < . 000, noteer voor p-waarden kleiner dan 0,001 in dat geval p < 0,001.

Een p-waarde meet de waarschijnlijkheid van het verkrijgen van de waargenomen resultaten, ervan uitgaande dat de nulhypothese waar is. Hoe lager de p-waarde, hoe groter de statistische significantie van het waargenomen verschil . Een p-waarde van 0,05 of lager wordt over het algemeen als statistisch significant beschouwd.

De p-waarde in een regressiemodel meet de kracht van het bewijs tegen de nulhypothese, en geeft aan of de waargenomen gegevens toevallig kunnen zijn . Een lage p-waarde (<0,05) suggereert dat de coëfficiënt statistisch significant is, wat een betekenisvol verband impliceert tussen de variabele en de respons.

In overeenstemming met de conventionele acceptatie van statistische significantie bij een P-waarde van 0,05 of 5%, wordt CI vaak berekend met een betrouwbaarheidsniveau van 95% . Als een waargenomen resultaat statistisch significant is bij een P-waarde van 0,05, mag de nulhypothese in het algemeen niet binnen het 95% BI vallen.

Maar P-waarden van 0,051 en 0,049 moeten op dezelfde manier worden geïnterpreteerd, ondanks het feit dat de 0,051 groter is dan 0,05 en daarom niet "significant" is en dat de 0,049 kleiner is dan 0,05 en dus "significant" is. Door feitelijke P-waarden te rapporteren wordt dit interpretatieprobleem vermeden.

Als we een antwoordoptie weergeven als statistisch significant, betekent dit dat de waarschijnlijkheid dat een verschil tussen twee groepen toevallig is of puur door een fout in de steekproefgrootte wordt veroorzaakt, minder dan 5% bedraagt. Dit wordt vaak weergegeven als p < 0,05.

Omdat het een waarschijnlijkheid is, kan P elke waarde tussen 0 en 1 aannemen .

Een P-waarde van 1,00 betekent dat iedereen deze vraag goed beantwoordt heeft. Een P-waarde van 0,00 betekent dat niemand deze vraag goed heeft beantwoord.

Hoe groter de standaarddeviatie, hoe meer de waarden onderling verschillen en hoe minder waarden gelijk zijn aan de gemiddelde waarde. Hoe kleiner de standaarddeviatie, hoe homogener de verdeling is. De p-waarde is een maat voor de kans dat de nulhypothese ten onrechte is verworpen.

Als een p-waarde die tijdens de test wordt gerapporteerd kleiner is dan 0,05, wordt dat resultaat statistisch significant genoemd . Als een p-waarde groter is dan 0,05, is het resultaat niet significant.

Als de p-waarde hoger is dan het significantieniveau, wordt de nulhypothese niet weerlegd en zijn de resultaten niet statistisch significant. Als de p-waarde lager is dan het significantieniveau, worden de resultaten geïnterpreteerd als een weerlegging van de nulhypothese en gerapporteerd als statistisch significant.

Een significante p-waarde betekent dat het effect of de associatie groot of klinisch betekenisvol is. Een niet-significante p-waarde betekent dat er geen effect of associatie is.