De geldigheid van een test

De geldigheid van een test / Experimentele psychologie

Als een test wordt gebruikt voor wat bedoeld is, zeggen we dat deze geldig is. Bijvoorbeeld a test van intelligentie Het is geldig als het de intelligentie meet. Betrouwbaarheid is de mate waarin een evaluatietool stabiele en consistente resultaten oplevert. De confabiliteit van de tests is een maat voor de betrouwbaarheid die wordt verkregen door dezelfde test twee keer gedurende een bepaalde periode aan een groep individuen toe te dienen.

Mogelijk bent u ook geïnteresseerd in: Klassieke testtheorie

Geldigheid van de tests

De tests zijn geldig in de mate dat ze meten wat ze moeten meten. We kunnen onderscheid maken tussen schijnbare geldigheid en bewezen validiteit:

  1. Schijnbare geldigheid : verwijst naar de mate waarin de test lijkt te meten wat u wilt meten.
  2. Bewezen validiteit : het is degene die op een empirische of experimentele manier is geverifieerd. Bewezen validiteit is empirisch of theoretisch.
  3. Empirische validiteit : het is empirisch als het op een praktische manier is bewezen. Een test voor het selecteren van stuurprogramma's is bijvoorbeeld geldig als u de goede stuurprogramma's onderscheidt van de slechte stuurprogramma's, ondanks dat u niet precies weet waarom u het krijgt.
  4. Theoretische geldigheid: het geeft de mate weer waarin met wetenschappelijke argumenten is aangetoond dat de test de eigenschap of eigenschap meet die het probeert te meten.

Een intelligentietest heeft bijvoorbeeld theoretische validiteit als er een bewijs van is dat is gebaseerd op een logische en experimentele verificatie.

  1. De schijnbare geldigheid: een test heeft schijnbare validiteit als het lijkt dat het meet wat het probeert te meten. Het is niet voldoende, hoewel het vaak nodig is. Vaak is het handig dat de test geldig lijkt voor de proefpersonen die deze moeten beantwoorden. Op andere momenten is het essentieel dat de test niet lijkt te meten wat hij meet. Dit is de eerste vereiste van effectieve validiteit. Om dit te bereiken, volstaat het niet dat de test geldig lijkt, maar moet worden geverifieerd dat dit zo is.
  2. Bewezen validiteit: effectieve validiteit is bewezen validiteit. Er zijn veel manieren om de geldigheid te bewijzen, sommige zijn empirisch en andere logisch-experimenteel..
  3. Empirische of criteriumvaliditeit: een test heeft empirische validiteit als is bewezen dat deze een praktisch doel dient. Een test is bijvoorbeeld geldig voor bepaalde stuurprogramma's als u de verschillende graden van deskundigheid in rijden onderscheidt.

de empirische validiteit het wordt ook genoemd criteriumvaliditeit, en om dit te verifiëren, moet een extern criterium voor geldigheid worden gedefinieerd. In het besproken voorbeeld is het externe criterium de rijvaardigheid. de coëfficiënt van de geldigheid van de test het is de correlatie tussen de test en het criterium. Als de beste in de test die zijn die beter leiden, heeft de test een hoge coëfficiënt van geldigheid met betrekking tot dat criterium, en we zullen een empirisch valide test hebben om bestuurders te selecteren.

Deze validiteit is wetenschappelijk blind, omdat we niet weten wat de validiteit van de test is. De test is geldig voor bepaalde stuurprogramma's, we weten niet waarom. De empirische validiteit kan worden ingedeeld in:

  1. Prospectieve of voorspellende validiteit of prognose: Het is diegene die wordt geverifieerd door de correlatie tussen de test en een later gemeten criterium. Bijvoorbeeld, als we veel aspirant-piloten hebben en we willen diegenen selecteren die meer geneigd zijn om na studeren en oefenen in goede piloten te worden. We kunnen bepaalde tests toepassen die voldoen aan de vereisten om een ​​goede piloot te zijn en alle aanvragers toe te laten. Na de studies en de geschikte praktijken zullen we de onderwerpen meten aan de hand van het criterium dat een goede piloot garandeert. Als de tests die de proefpersonen op het moment van opname hebben beantwoord, een hoge correlatie hebben met de vaardigheid als piloot, gemeten na het leren, misschien jaren later, kan worden bevestigd dat deze tests een hoge prospectieve geldigheid hebben. Deze validiteit wordt prospectieve, voorspellende en prognostische validiteit genoemd, omdat het de resultaten van de proefpersonen in het criterium kan voorspellen of gemakkelijk voorspellen, het dient om de kandidaten te selecteren die het meest waarschijnlijk goede piloten zijn..
  2. Inspectieve of gelijktijdige of concurrente geldigheid: Voorspellende geldigheid is meestal te duur om te testen; het is meestal buiten de praktische mogelijkheden van de psycholoog. Om deze reden wordt vaak naar de methode van inspectieve, gelijktijdige of gelijktijdige validiteit gekeken. Het is hetzelfde als de vorige procedure, maar de tests en het criterium worden gemeten in dezelfde of een gelijktijdige periode. Bijvoorbeeld, er wordt een geschikte steekproef van pilots gekozen, de juiste tests worden toegepast en deze worden gemeten in het vaardigheidscriterium. De coëfficiënt van gelijktijdige validiteit is de correlatie tussen de tests en het criterium. Het informeert ons in hoeverre de goede en de slechte in de test op dit moment goed en slecht zijn in het criterium. Het garandeert niet dat de beste kandidaten in de tests daarna de beste piloten zullen zijn.
  3. Retrospectieve validiteit: Het is de correlatie tussen de tests, toegepast op een bepaald moment, en een criterium dat eerder werd gemeten, misschien jaren daarvoor. Het doel ervan is om een ​​criterium uit het verleden te voorspellen, om uit het heden te achterhalen welke factoren en omstandigheden in het verleden de proefpersonen hebben beïnvloed en die enkele van de huidige kenmerken van de onderwerpen verklaren..
  4. De theoretische geldigheid: een test heeft theoretische geldigheid Als u meet wat u wilt meten.

De hoeveelheid waarin het wordt gemeten, wordt aangegeven met logische en experimentele argumenten die overeenkomen met de relatie tot een intern criterium. Er zijn verschillende soorten theoretische validiteit en deze zijn de volgende

  1. Inhouds- of voorbeeldgeldigheid : In de eerste plaats verwijst het naar tests van prestaties, kennis of professionele competentie. Een spellingstest is bijvoorbeeld geldig als de inhoud geschikt is. Om deze geldigheid te verifiëren, zal het spellingsveld worden onderzocht en zal worden geverifieerd dat de items waaruit de test bestaat een onpartijdige en voldoende steekproef van dit veld zijn. Dit type geldigheid kan niet worden gespecificeerd in enige vorm van correlatie. Brengt de relatie tot uitdrukking tussen de test en het interne criterium gevormd door de materie waarnaar de test verwijst. De verhouding zal hoger zijn naarmate het hele onderwerp beter wordt weergegeven door de test. Deze validiteit wordt bereikt omdat er garanties zijn dat de verschillende aspecten van een bepaald gebied van kennis of vaardigheden die de test probeert te meten duidelijk zijn gedefinieerd. Kritiek op de steekproefvaliditeit van een test impliceert dat het aantoont dat het niet voldoende het veld vertegenwoordigt waarnaar het verwijst.
  2. Construct of conceptuele geldigheid : Bestaat in het controleren, volgens de methodologie van wetenschappelijk onderzoek, dat de test de variabele meet waarnaar het verwijst. Het probeert wetenschappelijk te waarborgen dat de variabele die de test probeert te meten een acceptabele variabele is, waarvan het concept voldoende logische consistentie heeft binnen het theoretische systeem van psychologie en wordt ondersteund door voldoende experimentele verificaties die dit verifiëren. Voordat bijvoorbeeld een geldige test voor het meten van intelligentie wordt aangeboden, moet worden verduidelijkt welke intelligentie de test probeert te meten.
  3. Factoriale geldigheid: Komt voor wanneer verschillende tests worden gecorreleerd aan een gegeven kenmerk en vervolgens worden onderworpen aan een factorrelatie.
  4. Congruente validiteit: als we verschillende variabelen meten met tests van hetzelfde type, moeten de tests die naar een variabele verwijzen, hogere correlaties met elkaar hebben dan de tests met andere variabelen..
  5. Discriminatieve validiteit: Als we verschillende variabelen meten met tests van hetzelfde type en dezelfde variabele met tests van verschillende typen, moeten deze tests van verschillende typen die naar dezelfde variabele verwijzen, hogere correlaties hebben dan de tests van hetzelfde type die verwijzen naar naar verschillende variabelen.
  6. Structurele validiteit: Het is de mate waarin de test een uitwerking of een theoretisch kenmerk meet. Alle gegevens die enige informatie geven over de aard van de eigenschap die we overwegen en de omstandigheden die de ontwikkeling en manifestaties beïnvloeden, zijn nuttig voor dit type geldigheid.