De 4 verschillen tussen betrouwbaarheid en validiteit (in de wetenschap)
Omdat ze in de omgangstaal heel vergelijkbare betekenissen hebben, is het gemakkelijk om de termen betrouwbaarheid en geldigheid te verwarren wanneer we het hebben over wetenschap en specifiek over psychometrie..
Met deze tekst willen we de grote verschillen tussen betrouwbaarheid en validiteit. Hopelijk vind je het nuttig om deze gebruikelijke twijfel te verhelderen.
- Gerelateerd artikel: "Psychometrie: de menselijke geest bestuderen door middel van gegevens"
Wat is betrouwbaarheid?
In psychometrie is het concept "betrouwbaarheid" verwijst naar de nauwkeurigheid van een instrument; In het bijzonder informeren de betrouwbaarheidscoëfficiënten ons over de consistentie en stabiliteit van de maatregelen die met dat gereedschap zijn genomen.
Hoe groter de betrouwbaarheid van een instrument, des te lager de hoeveelheid willekeurige en onvoorspelbare fouten die zullen verschijnen wanneer het wordt gebruikt om bepaalde attributen te meten. Betrouwbaarheid sluit voorspelbare fouten uit, dat wil zeggen degene die onderhevig zijn aan experimentele controle.
Volgens de klassieke testtheorie is betrouwbaarheid de proportie van de variantie die wordt verklaard door de echte scores. De directe score in een test zou dus bestaan uit de som van de willekeurige fout en de echte score.
De twee belangrijkste componenten van betrouwbaarheid het zijn tijdelijke stabiliteit en interne consistentie. Het eerste concept geeft aan dat de scores weinig veranderen wanneer ze bij verschillende gelegenheden worden gemeten, terwijl de interne consistentie verwijst naar de mate waarin de items waaruit de test bestaat dezelfde psychologische constructie meten..
Daarom geeft een hoge betrouwbaarheidscoëfficiënt aan dat de scores op een test intern weinig schommelen en als een functie van de tijd en, kort samengevat, dat het instrument is afwezig van meetfouten.
- Misschien ben je geïnteresseerd: "Soorten psychologische tests: hun functies en kenmerken"
Definitie van geldigheid
Wanneer we spreken van validiteit, verwijzen we naar de vraag of de test het construct dat het wil meten, juist meet. Dit concept wordt gedefinieerd als de relatie tussen de score verkregen in een test en een andere gerelateerde meting; de mate van lineaire correlatie tussen beide elementen bepaalt de geldigheidscoëfficiënt.
Ook in wetenschappelijk onderzoek geeft een hoge validiteit aan in hoeverre de resultaten bekomen met een bepaald instrument of in een onderzoek gegeneraliseerd kunnen worden.
Er zijn verschillende soorten validiteit, die afhankelijk zijn van de manier waarop deze wordt berekend; dit maakt het een term met heel verschillende betekenissen. In principe kunnen we onderscheid maken tussen inhoudsvaliditeit, criterium (of empirische) validiteit en constructvaliditeit.
Inhoudsvaliditeit definieert in welke mate de items van een psychometrische test een representatief voorbeeld zijn van de elementen waaruit het te evalueren construct bestaat. Het instrument moet alle fundamentele aspecten van het construct omvatten; Als we bijvoorbeeld een adequate test willen maken om depressie te meten, moeten we noodzakelijkerwijs items bevatten die de stemming beoordelen en minder plezier ervaren.
Criteriumvaliditeit meet het vermogen van het instrument om aspecten te voorspellen die verband houden met het kenmerk of interessegebied. Ten slotte is de constructvaliditeit bedoeld bepalen of de test meet wat hij van plan is te meten, bijvoorbeeld uit de convergentie met de scores die in soortgelijke tests zijn verkregen.
Verschillen tussen betrouwbaarheid en validiteit
Hoewel deze twee psychometrische eigenschappen nauw verwant zijn, is de waarheid dat ze verwijzen naar duidelijk gedifferentieerde aspecten. Laten we kijken wat deze verschillen zijn.
1. Het object van analyse
Betrouwbaarheid is een kenmerk van het instrument, in die zin dat het de eigenschappen meet van de items waaruit het bestaat. Aan de andere kant verwijst de validiteit niet precies naar het instrument maar naar de generalisaties die worden gemaakt op basis van de resultaten verkregen via deze.
2. De informatie die zij verstrekken
Hoewel het een enigszins simplistische manier is om het te zeggen, wordt in het algemeen vaak gezegd dat validiteit aangeeft dat een psychometrische tool feitelijk het construct meet dat het wil meten, terwijl betrouwbaarheid verwijst naar of het correct meet, zonder fouten.
3. De manier waarop ze worden berekend
Drie procedures worden fundamenteel gebruikt om de betrouwbaarheid te meten: de methode van de twee helften, die van parallelle vormen en de test-hertest. De meest gebruikte procedure is de procedure van de twee helften, waarin de items in twee groepen worden verdeeld zodra de test is beantwoord; vervolgens wordt de correlatie tussen de twee helften geanalyseerd.
De methode van parallelle of alternatieve vormen bestaat uit het maken van twee equivalente tests om te meten in hoeverre zij de items daartussen correleren. De test-hertest is eenvoudig gebaseerd op het twee keer doorgeven van de test, onder omstandigheden die zo veel mogelijk overeenkomen. Beide procedures kunnen worden gecombineerd, wat aanleiding geeft tot de test-hertest met parallelle vormen, die bestaat uit het laten van een tijdsinterval tussen de eerste vorm van de test en de tweede.
Van zijn kant, de geldigheid het wordt op verschillende manieren berekend, afhankelijk van het type, maar in het algemeen zijn alle methoden gebaseerd op de vergelijking tussen de score in de objectieve test en andere gegevens van dezelfde onderwerpen in relatie tot vergelijkbare kenmerken; het doel is dat de test kan fungeren als een voorspeller van het kenmerk.
Onder de methoden die worden gebruikt om de validiteit te evalueren, vinden we de factoriële analyse en de techniek van multi-methode-multi-trait-matrices. Ook wordt de geldigheid van inhoud vaak bepaald door rationele, niet-statistische analyses; het omvat bijvoorbeeld de schijnbare geldigheid, die verwijst naar het subjectieve oordeel van deskundigen over de geldigheid van de test.
4. De relatie tussen beide concepten
De betrouwbaarheid van een psychometrisch instrument heeft invloed op de geldigheid: Hoe betrouwbaarder het is, hoe groter de geldigheid. Daarom zijn de geldigheidscoëfficiënten van een tool altijd lager dan de betrouwbaarheidscoëfficiënten, en de geldigheid informeert ons indirect over de betrouwbaarheid.