Kwantitatieve analyse

Informatie samenvatten met behulp van statistiek

 

 

Wat is het?

Statistische analyses zijn eigenlijk niets anders dan een manier om informatie samen te vatten. Met behulp van statistische maten, zoals het gemiddelde, de standaarddeviatie of de correlatiecoëfficiënt, vat je de berg verzamelde cijfers samen, zodat de essentie zichtbaar wordt en je antwoord kunt geven op je onderzoeksvragen.

 

Wanneer gebruik je het? En Waarom?

Statistische analysemethoden gebruik je als je in je onderzoek veel kwantitatieve informatie (informatie in de vorm van cijfers) hebt verzameld. Als je bijvoorbeeld een tevredenheidsenquête hebt gedaan waarin je vijfhonderd medewerkers hebt gevraagd om op een schaal van 1 (zeer ontevreden) tot en met 5 (zeer tevreden) aan te geven hoe tevreden zijn over tien verschillende aspecten van hun werk (salaris, werksfeer, stijl van leidinggeven, etc.), dan is het vrijwel onmogelijk om uit de informatie die je hebt verzameld met het blote oog conclusies te trekken. Je kunt dan de informatie samenvatten door per vraag de gemiddelde score van de 500 medewerkers te berekenen. Je verliest dan informatie, maar de essentie wordt zichtbaar. Je ziet dan bijvoorbeeld dat de gemiddelde medewerker op de vraag “Hoe tevreden bent u met uw salaris?” het antwoord 2 geeft. Je kunt dan concluderen dat de gemiddelde medewerker ontevreden is over het salaris.   

 

Hoe pas je het toe?

Het doel van je kwantitatieve analyses is om antwoord te geven op de onderzoeksvragen. Je onderzoeksvragen bepalen dus welke analyses je gaat doen. Hieronder bespreken we drie typen veel voorkomende vragen. 

 

1. Wat is de waarde van deze variabele?

Voorbeelden van dit type vragen zijn: “Hoe tevreden zijn de medewerkers met hun salaris?”, “Hoe hoog is het ziekteverzuim?”, of “In hoeverre zijn medewerkers bereid om mee te werken aan deze organisatieverandering”. Als je wilt weten hoe tevreden medewerkers zijn met hun salaris, dan kun je bijvoorbeeld medewerkers in een enquête vragen om op een 5-puntsschaal, van 1 (zeer ontevreden) tot en met 5 (zeer tevreden), aan te geven hoe (on)tevreden ze zijn. In dat geval bereken je de gemiddelde score (M) van de medewerkers op de variabele (tevredenheid met salaris) en de bijbehorende standaarddeviatie (SD) en steekproefomvang (n). Deze gemiddelde score kun je vervolgens vergelijken met een zelf-geformuleerde norm (we vinden dat de gemiddelde tevredenheid minimaal 4 moet zijn) of met een benchmark (de gemiddelde tevredenheid van medewerkers in deze sector is 3). Zo kun je beoordelen of je als organisatie een probleem hebt waar je wat aan moet doen. In het resultatenhoofdstuk van je rapportage neem je dan een tabel op zoals hieronder. In de begeleidende tekst licht je kort toe wat deze cijfers betekenen.

 

2. Zijn er verschillen tussen groepen?

Voorbeelden van dit type vragen zijn: “Zijn mannen tevredener over hun salaris dan vrouwen?”, “Zijn er verschillen in verzuim tussen de kantoor- en de productiemedewerkers?”, of “Zijn de medewerkers van 20-30 jaar meer bereid om mee te werken aan de geplande organisatieverandering dan de medewerkers van 50- 60 jaar?”. Als je bijvoorbeeld wilt weten of mannen tevredener zijn met hun salaris dan vrouwen, dan bereken je de gemiddelde tevredenheidsscores van de mannelijke medewerkers (Mm) en de vrouwelijk medewerkers (Mv) en de bijbehorende standaarddeviaties (SD) en steekproefomvang (n). Vervolgens vergelijk je de gemiddelde scores met elkaar: is de gemiddelde tevredenheidsscore van mannen hoger dan die van vrouwen? Om te controleren of het verschil significant is, kun je een statistische toets (ANOVA) uitvoeren. In het resultatenhoofdstuk van je rapportage neem je dan een tabel op zoals hieronder. In de begeleidende tekst licht je kort toe wat deze cijfers betekenen1.

 

3. Is er een samenhang tussen variabelen?

Voorbeelden van dit type vragen zijn: “Zijn medewerkers tevredener over hun salaris naarmate ze een hoger salaris ontvangen?”, “Is er een samenhang tussen ervaren werkdruk en ziekteverzuim?”, of “In hoeverre wordt de weerstand van medewerkers tegen organisatieveranderingen bepaald door gebrek aan informatie?”. Als je bijvoorbeeld wilt weten welke factoren van invloed zijn op het ziekteverzuim, dan kun je variabelen zoals leeftijd, salaris en ervaren werkdruk meten, om vervolgens te berekenen hoe deze variabelen correleren met het verzuim. Om correlaties te berekenen is het van belang dat je variabelen op ratio- of intervalniveau gemeten zijn (het moeten dus continue variabelen zijn zoals leeftijd of lengte; geen categorische variabelen zoals man/vrouw of opleidingsniveau). De correlatie kan variëren tussen -1 en +1. Hoe verder van 0 (dus hoe dichter bij -1 of +1), hoe sterker de samenhang. In het resultatenhoofdstuk van je rapportage neem je dan een tabel op zoals hieronder. In de begeleidende tekst licht je kort toe wat deze cijfers betekenen1.

 

Voor het uitvoeren van je kwantitatieve analyses kun je het beste een statistiekprogramma gebruiken, zoals SPSS. Je kunt dit programma downloaden via https://www.surfspot.nl/. Het berekenen van gemiddelden en standaarddeviaties (vraagtype 1) doe je via het tabblad analyse > descriptives in SPSS, het berekenen en toetsen van verschillen in gemiddelde scores tussen groepen (vraagtype 2) doe je via analyse > compare means, het berekenen en toetsen van correlaties (vraagtype 3) doe je via analyse > correlate.    

 

Op internet vind je veel video’s met instructie en uitleg over kwantitatieve analyses. Niet iedere statisticus is een ster in het uitleggen, dus denk niet meteen dat het aan jou ligt als je iets niet begrijpt. Zoek net zolang door tot je een video vindt van iemand die het op een voor jou begrijpelijke manier uitlegt.   

 

1 Belangrijke statistische maten:

  • M = Gemiddelde.
  • SD = Standaarddeviatie: een maat voor de spreiding van de data.
  • n = Steekproefomvang
  • F(x,x) = Fischer’s F: een maat om te bepalen of de scores van de ene groep verschillen van de scores van een andere groep.
  • η2 = Eta Squared: een maat om de samenhang tussen een categorische en een continue variabele uit te drukken.
  • r = Correlatiecoëfficient: een maat om de samenhang tussen twee continue variabelen uit te drukken.  
  • p = Propability value: een maat om de significantie van een gevonden uitkomst uit te drukken (de kans dat je deze uitkomst vindt, terwijl de nulhypothese correct is). 

 

Meer informatie