Meetniveaus van variabelen

Meetniveaus van variabelen

Bij kwantitatief onderzoek meten we de waarden van één of meer variabelen. Een variabele is een eigenschap of kenmerk van een persoon (bijvoorbeeld: geslacht, oogkleur of lengte), een product (bijvoorbeeld: alcoholpercentage van bier) of een situatie (bijvoorbeeld: wel of geen achtergrondmuziek in een winkel). Van elk van deze variabelen kan je verschillende waarden vaststellen, vaak door deze te meten bij verschillende personen, producten en/ of situaties. Afhankelijk van het meetniveau mogen we bepaalde rekenkundige bewerkingen wel of niet uitvoeren.

Vier meetniveaus

Een waarde is een score op een bepaalde variabele (bijvoorbeeld: ‘1,78 meter’ als indicatie van de lengte van een persoon). Bij de variabele lichaamslengte kunnen we de scores uitdrukken in (centi-) meters. Bij volwassen Nederlanders zullen de waarden waarschijnlijk liggen tussen 1,50 en 2,10 meter; in dat geval zijn er 61 waarden vast te stellen (1,50 tot en met 2,10). Ten aanzien van geslacht kunnen we slechts twee waarden onderscheiden: man of vrouw. Bij lichaamslengte kunnen we stellen dat 1,80 meter langer is dan 1,60 meter. Bij geslacht kunnen we echter niet stellen dat een vrouw ‘meer’ is dan een man. De reden is dat we hier met verschillende meetniveaus van variabelen te maken hebben.

Variabelen kunnen op vier niveaus worden gemeten: nominaal, ordinaal, interval- of rationiveau. De volgorde van deze niveaus is makkelijk te onthouden; de beginletters vormen namelijk het woord ‘noir’. Het is belangrijk te constateren op welk niveau een variabele is gemeten. Zoals gezegd, bepaalt het meetniveau de rekenkundige bewerkingen die je er op mag uitvoeren. Concreet betekent dit bijvoorbeeld dat je niet mag stellen dat 40º Celsius twee keer zo warm is als 20º Celsius, maar wel dat 40º Kelvin twee keer zo warm is als 20º Kelvin. Hieronder lichten we dit toe door de kenmerken van de vier verschillende meetniveaus te beschrijven. Hieronder hebben we de kenmerken van de vier meetniveaus samengevat.

1 – Nominaal niveau

Als een variabele is gemeten op nominaal niveau is de meting niet meer dan slechts een codering (een label of een etiket). Er is geen hiërarchisch verschil tussen de waarden; je kunt de waarden dus niet rangordenen. Goede voorbeelden van dergelijke variabelen zijn: geslacht, geloofsovertuiging, kleur haar en bezit van bepaalde goederen. Voor wat betreft geloofsovertuiging kan je dus niet zeggen: ‘protestant is twee keer zo veel als katholiek’. Dit betekent dat op nominale data cijfermatige berekeningen niet zijn toegestaan; je kunt het aantal waarnemingen van de verschillende waarden alleen maar tellen (‘turven’) en verschillen uitdrukken in frequenties (bijvoorbeeld: 60% is protestant en 30% is katholiek). Samenvattend:

  • Niveau: naam
  • Toegestane rekenkundige bewerkingen: frequenties

2 – Ordinaal niveau

We spreken van een ordinaal meetniveau als er sprake is van een nominale variabele waar je een rangorde (hiërarchie) tussen de waarden kunt vaststellen. Een hogere waarde betekent meer van de gemeten eigenschap dan een lagere waarde; er is echter geen vaste afstand (‘equidistantie’) tussen de punten. Bijvoorbeeld: als je op grond van smaak zes bieren ordent, kan het zijn dat je er twee heel lekker vindt en de andere vier niet. Het aangeven van een rangorde houdt dus niet in dat het verschil tussen bier één (de lekkerste) en twee (de op één na lekkerste) even groot is als het verschil tussen bijvoorbeeld bier drie en vier (misschien vond je bier 1 en 2 heel veel op elkaar lijken, en zat er tussen bier 3 en 4 een wereld van verschil). Ook hier mag je qua toegestane rekenkundige bewerkingen niet meer dan frequenties weergeven. Samenvattend:

  • Niveau: naam + volgorde
  • Toegestane rekenkundige bewerkingen: frequenties

3 – Intervalniveau

Als een variabele is gemeten op intervalniveau is er net als op ordinaal niveau sprake van een rangorde (hiërarchie) tussen de waarden met dit verschil dat de afstand tussen die waarden even groot is (‘equidistantie’). Bij variabelen op ordinaal niveau is er sprake van een arbitrair (gekozen) nulpunt. De schaal graden Celsius is wellicht een van de bekendste variabelen gemeten op intervalniveau. We kunnen hier stellen dat het verschil tussen 30° en 40° Celsius evenveel is als het verschil tussen 60° en 70° Celsius. Omdat het nulpunt arbitrair is (namelijk 0° Celsius: het punt waar water bevriest) mag je echter niet zeggen dat 40° twee keer zo warm is als 20° Celsius. In onderstaand kader illustreren we dit met een voorbeeld. De toegestane rekenkundige bewerkingen zijn hier beperkt tot zogenoemde lineaire berekeningen (optellen en aftrekken); multiplicatieve berekeningen (vermenigvuldigen en delen) zijn hier niet toegestaan. Samenvattend:

  • Niveau: naam + volgorde + gelijke afstand
  • Toegestane rekenkundige bewerkingen: lineair

4 – Rationiveau

Als een variabele is gemeten op rationiveau (ratio betekent hier ‘verhouding’), dan is er in feite sprake van een intervalniveau met een vast nulpunt (ofwel een natuurlijke ondergrens). De verhoudingen tussen de waarden mag je dan rechtstreeks interpreteren als verhoudingen tussen hoeveelheden van de variabele. Een goed voorbeeld is temperatuur uitgedrukt in graden Kelvin. Deze schaal heeft een vast absoluut nulpunt: 0° Kelvin (dit komt overeen met -273° Celsius). Andere voorbeelden van variabelen die zijn gemeten op rationvieau zijn tijd, lengte, afzet, omzet en inkomen. Omdat er hier sprake is van een absoluut nulpunt, zijn alle rekenkundige bewerkingen toegestaan; zowel lineair als multiplicatief (i.e. vermenigvuldigen en delen). Samenvattend:

  • Niveau: naam + volgorde + gelijke afstand + vast nulpunt
  • Toegestane rekenkundige bewerkingen: lineair + multiplicatief

Waarom mag je bij graden Celsius geen multiplicatieve berekeningen uitvoeren?

Het bewijs is als volgt te leveren. Je zou geneigd zijn te stellen dat 40° twee keer zo warm is als 20° Celsius. Als we dit vergelijken met een andere intervalschaal blijkt dat we dit inderdaad niet kunnen zeggen.

Veronderstel dat benzine bij -20° Celsius bevriest; we kiezen dit nulpunt voor een nieuwe temperatuurschaal: de Benzin-schaal. Dit is ook een schaal op intervalniveau. Als we nu het verschil tussen 40° en 20° Celsius afzetten op de Benzin-schaal, dan blijkt het volgende:

celsiusbenzin

Het verschil tussen 40° en 20° Celsius is op de Benzin-schaal: 60° en 40° Benzin en 60 is niet twee keer zoveel als 40!

Een ander voorbeeld betreft onze kalender. Het jaar 0 is (arbitrair) gekozen op basis van het vermeende geboortejaar van Jezus. Het moge duidelijk zijn dat in het jaar 2000 de aarde niet twee keer zo oud was als in het jaar 1000.

Ten slotte

In statistiekboeken worden soms andere aanduidingen gebruikt voor de vier hierboven beschreven meetniveaus. Naar data op nominaal of ordinaal wordt ook wel verwezen als categorische data of data op niet (para-) metrisch niveau. Interval- of rationiveau wordt ook wel (para-) metrisch niveau genoemd.

 


Download PDF van dit artikel.

Auteur:

Geef een reactie

Je email adres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *

Reactie plaatsen