Wat is een steekproef?
Een steekproef is een selectie van een aantal eenheden uit een grotere populatie, die je onderzoekt om conclusies te kunnen trekken over die hele populatie. Bijvoorbeeld, in een productieproces wil je misschien weten of een bepaalde maatregel de kwaliteit van de producten verbetert. In plaats van elk product te controleren, neem je een steekproef van een aantal producten. Deze steekproef geeft je, mits goed gekozen, een betrouwbaar beeld van de hele productielijn.
Het gebruik van steekproeven bespaart tijd en kosten, terwijl je toch inzicht krijgt in het gehele proces. Het is belangrijk dat de steekproef representatief is, zodat de resultaten daadwerkelijk iets zeggen over de hele populatie. Stel, je neemt alleen producten van het begin van de productielijn, dan kan dat een vertekend beeld geven. Daarom is het cruciaal om een steekproef zorgvuldig en volgens bepaalde methoden te trekken om betrouwbare en valide conclusies te kunnen trekken.
Wat zijn eisen voor een goede steekproef?
Een goede steekproef is een essentieel onderdeel van elk onderzoek of verbeterproject, omdat het de basis vormt voor de conclusies die je trekt. Om een steekproef representatief te maken, moet deze zorgvuldig worden samengesteld. In een kantooromgeving betekent dit dat je ervoor zorgt dat je steekproef werknemers van verschillende afdelingen, ervaringsniveaus en functies omvat. Dit zorgt ervoor dat de resultaten een goed beeld geven van de hele organisatie, in plaats van slechts een deel daarvan. Daarnaast moet de steekproef willekeurig zijn, zodat elke medewerker een gelijke kans heeft om geselecteerd te worden. Dit voorkomt bias en zorgt ervoor dat de steekproef daadwerkelijk representatief is. Tot slot moet de steekproef groot genoeg zijn om statistisch significante resultaten te verkrijgen, zonder onnodige tijd en middelen te verspillen. De criteria voor een goede steekproef zijn dus:
Representatief: De steekproef moet een goede afspiegeling zijn van de hele populatie. Dit betekent dat alle relevante groepen binnen de populatie moeten worden meegenomen.
Willekeurig: Het is belangrijk dat elke eenheid in de populatie een gelijke kans heeft om in de steekproef te komen. Dit voorkomt vooringenomenheid en zorgt voor een eerlijke representatie.
Groot genoeg: De steekproef moet voldoende omvang hebben om betrouwbare en nauwkeurige resultaten te geven, zonder onnodige middelen te verspillen. Hoe je precies de juiste omvang bepaalt, wordt hierna besproken.
Omvang van een steekproef
Het bepalen van de juiste omvang van een steekproef is dus belangrijk. In sommige gevallen kun je de gehele populatie meten, bijvoorbeeld door een export te maken van alle cijfers van het afgelopen jaar. Maar vaak is dit niet mogelijk of praktisch, en dan is een steekproef nodig. Een belangrijke overweging hierbij is dat je wel genoeg moet meten om representatieve resultaten te krijgen. Een goed voorbeeld is het meten van kijkcijfers in Nederland. Er zijn maar een paar duizend huishoudens met speciale meetkastjes, maar hun kijkgedrag geeft een goed beeld van wat miljoenen Nederlanders op televisie kijken. Hoeveel kastjes zijn er nodig om representatieve kijkcijfers te krijgen? Dit hangt af van hoe divers de populatie is en hoeveel precisie je nodig hebt.
Grofweg zijn er twee manieren om de omvang van een steekproef te bepalen:
De wetenschappelijke manier: Hierbij gebruik je statistische formules en concepten zoals betrouwbaarheidsniveaus en foutmarges. Je stelt bijvoorbeeld een betrouwbaarheidsniveau van 95% in, wat betekent dat je er 95% zeker van wilt zijn dat de resultaten van je steekproef representatief zijn voor de hele populatie. Je kiest ook een foutmarge, zoals 5%, wat aangeeft hoeveel de steekproefresultaten mogen afwijken van de werkelijke waarden in de populatie. Met deze gegevens en de geschatte standaarddeviatie van de populatie kun je een steekproefomvang berekenen. Deze methode is nauwkeurig, maar kan ertoe leiden dat je heel veel moet meten, wat in de praktijk niet altijd handig is.
Werken met vuistregels: Voor verbeterprojecten kan je ook prima werken met minimale hoeveelheden die voldoende nauwkeurigheid bieden. Het is dan niet helemaal volgens academische regels, maar nog wel statistisch verantwoord. Daarbij wordt onderscheid gemaakt of data continu is (gemiddelde en spreiding) of discreet (tellingen of proporties). Dit zijn eenvoudige richtlijnen die je snel kunt toepassen zonder complexe berekeningen, ongeacht hoe groot de populatie is.
Vuistregels voor de steekproefgrootte
Mensen staan er vaak versteld van hoe weinig je hoeft te meten om toch statistisch verantwoord bezig te zijn. Het is echter belangrijk om te weten dat dit minimale aantallen zijn; meer metingen geven altijd een beter beeld. Door slechts een klein aantal waarnemingen te doen, kun je al betrouwbare inzichten krijgen:
Voor het berekenen van een gemiddelde: Minimaal 5-10 waarnemingen. Dit geeft je een basisidee van het zwaartepunt of de centrale tendens in je data. Dat klinkt als heel weinig, maar test het maar eens. Bereken de gemiddelde lengte van enkele volwassen mannen of vrouwen om je heen, en je zult zien dat dit al héél dicht in de buurt ligt van het Nederlands gemiddelde.
Voor het schatten van de spreiding: Minimaal 20-30 waarnemingen. Omdat spreidingsmaatregelen zoals de standaarddeviatie gevoeliger zijn voor variatie en uitschieters in de data, moet je iets meer meten. Een grotere steekproef helpt om deze variaties beter te begrijpen en een nauwkeurigere schatting te verkrijgen.
Voor discrete data: Minimaal 100 waarnemingen en minimaal 5 afwijkende gevallen. Dit zorgt ervoor dat je genoeg data hebt om zeldzamere gebeurtenissen goed te kunnen vastleggen en analyseren. Afwijkingen zijn resultaten die anders zijn. Bijvoorbeeld als je aan 100 mensen vraagt of ze tevreden zijn (ja/nee), en 90 zeggen ja en 10 zeggen nee, dan voldoe je aan de minimale steekproefgrootte. Zeggen 98 ja en 2 nee, dan moet je nog even doormeten.
Voorbeeld ziekenhuis: Stel, je wilt in een ziekenhuis meten hoe lang patiënten gemiddeld moeten wachten op een behandeling. Voor een gemiddelde zou je minimaal 5-10 patiënten kunnen ondervragen. Maar als je de variatie in wachttijden wilt onderzoeken, zou je minimaal 20-30 patiënten moeten ondervragen.
Voorbeeld gemeente: In een gemeente wil je weten hoeveel huishoudens afval scheiden. Voor een betrouwbare schatting heb je minimaal 100 huishoudens nodig, waarbij je ten minste 5 huishoudens hebt die niet aan afvalscheiding doen om een beeld te krijgen van de afwijkingen.
Artikel gaat verder na de afbeelding.