Theorieën van de TCT- en TRI-tests
De testen worden in de psychologie gebruikt als meetinstrumenten. Om een beetje bij te stellen in het concept en zonder volledig accuraat te zijn, net zoals we de meter gebruiken om de lengte te meten, zouden we een test kunnen gebruiken om intelligentie, geheugen, aandacht te meten ... Een van de verschillen tussen de ene en de andere actie zou zijn dat de tests zijn niet zo eenvoudig om te bouwen, als aanvulling op hoe weinig ze zo eenvoudig toe te passen zijn.
Omdat een enkele meting ons niet toelaat om over het volume van een object te praten, staat het toedienen van een enkele test ons niet toe om een diagnose te stellen of een interventie voor te stellen. dus, de testen zijn belangrijk voor de evaluatie, maar ze zijn geen bepalende factor.
Dit is waar de psycholoog de belangrijkste rol speelt: op de een of andere manier moet hij de informatie gebruiken die hij uit de test en uit andere bronnen heeft verkregen om vorm geven aan een coherente evaluatie die plaats maakt voor de planning van de interventie. Met andere woorden, het is op het moment van integratie van de resultaten van verschillende bronnen waar de kwaliteit van de professional het meest opvallend is. We spreken van een vaardigheid die wordt bereikt met kennis, maar ook met jarenlange ervaring.
Korte geschiedenis van de theorieën van de tests
De oorsprong van de tests wordt meestal vermeld in tests die zijn uitgevoerd door Chinese keizers in de jaren 3000 vóór Christus. Deze hadden dus tot doel de vakbekwaamheid te evalueren van de officieren die hun dienst zouden gaan betreden. (1)
De huidige tests komen het dichtst in de buurt van de tests die door Galton zijn uitgevoerd (1822-1911) in zijn laboratorium. Het is echter James Cattell die de term voor het eerst gebruikte mentale test, in 1890. Omdat deze eerste tests niet te voorspellend waren gebleken voor de cognitieve capaciteit van de mens, introduceren onderzoekers zoals Binet en Simon (1905) in hun nieuwe schaal cognitieve taken om aspecten als oordeel, begrip en redenering te evalueren.
De schaal van Binet opent een traditie van individuele schalen. Naast cognitieve tests worden er grote vorderingen gemaakt in persoonlijkheidstests.
Waarom zijn de theorieën van de tests noodzakelijk??
Vóór alle voortschrijdende ontwikkelingen, beginnen ze op hun beurt theorieën van meting (theorieën van de tests) te ontwikkelen die de testen rechtstreeks als instrumenten beïnvloeden. Met de zorg om instrumenten te genereren die meten wat we willen dat ze meten en het doen met de minst mogelijke fout, verschijnt psychometrie. Een psychometrie die elke test of elk meetinstrument vereist, dat beweert te zijn, dat geldig is en dat betrouwbaar is,
Bedenk dat het betrouwbaarheid het wordt begrepen als de stabiliteit of consistentie van de metingen wanneer het meetproces wordt herhaald. Met andere woorden, een test is betrouwbaarder, hoe beter deze de resultaten repliceert bij het meten van twee onderwerpen - of hetzelfde onderwerp in verschillende kansen - die hetzelfde niveau in de gemeten hebben. Van zijn kant, validiteit verwijst naar de mate waarin empirisch bewijs en theorie de interpretatie van scores ondersteunen van de tests. (2)
Er zijn dus twee grote theorieën over de tests of benaderingen wanneer we het hebben over het analyseren en construeren van dit soort instrumenten: de klassieke theorie van de tests (TCT) en de theorie van reactie op de items (TRI).
De klassieke theorie van de tests (TCT)
Het is de dominante theorie in de constructie en analyse van de tests. De kom: het is relatief eenvoudig om tests te maken die aan de minimumvereisten van dit paradigma voldoen. De evaluatie van de test zelf in termen van de genoemde parameters is ook relatief eenvoudig: betrouwbaarheid en validiteit.
Het vindt zijn oorsprong in de werken van Spearman aan het begin van de 20e eeuw. Vervolgens, in 1968, voeren de onderzoekers van Lord en Novick een herformulering van deze theorie uit en openen ze de weg naar de nieuwe benadering van de TRI.
Deze theorie is gebaseerd op het klassieke lineaire model. Dit model is voorgesteld door Spearman en bestaat uit het aannemen van dat de score die een persoon krijgt in een test, die we zijn empirische score noemen, en die meestal wordt aangeduid met de letter X, bestaat uit twee componenten. (2)
Aan de ene kant vinden we de echte score van het onderwerp in de test (V), en aan de andere kant de fout (e). Het wordt als volgt uitgedrukt: X = V + e.
Spearman voegt drie aannames toe aan deze theorie:
- Definieer eerst de echte score (V) als de wiskundige hoop van de Empirische score: Het is de score die een persoon zou hebben in een test als hij het een oneindig aantal keren deed.
- niet er is verhouding tussen de aantal echte scores en de grootte van fouten die van invloed zijn op die scores.
- Eindelijk, de Meetfouten in een test dat zijn ze verwant met de meetfouten in een andere test verschillen.
Om deze theorie te voltooien, definieert Spearman de parallelle tests zoals die tests die hetzelfde meten, maar met verschillende items.
Beperkingen van de klassieke benadering
De eerste beperking is dat, binnen deze theorie, de metingen niet onveranderlijk zijn met betrekking tot het gebruikte instrument. Dit betekent dat als een psycholoog de intelligentie evalueert van drie personen met een andere test voor elke persoon, de resultaten niet vergelijkbaar zijn. Maar waarom gebeurt dit??
Welnu, de resultaten van de drie meetinstrumenten zijn niet op dezelfde schaal: elke test heeft zijn eigen schaal. Om bijvoorbeeld de intelligentie van X-mensen die zijn geëvalueerd met verschillende intelligentietests te kunnen vergelijken, is het noodzakelijk transformeren de verkregen scores rechtstreeks uit de test op andere schalen.
Het probleem hiermee is dat door de scores om te zetten in baremadas, we aannemen dat de normatieve groepen waarin ze zijn uitgewerkt de schalen van de verschillende tests zijn vergelijkbaar - hetzelfde gemiddelde, dezelfde standaarddeviatie-, wat moeilijk te garanderen is in de praktijk. (1) Aldus veronderstelde de nieuwe benadering van de TRI een grote vooruitgang met betrekking tot dit feit. De TRI zal dus bereiken dat de resultaten verkregen door het gebruik van verschillende instrumenten op dezelfde schaal zijn.
De tweede beperking van deze benadering is het gebrek aan invariantie van testeigenschappen met betrekking tot de mensen die het schatten. In het kader van de TCT zijn de belangrijke psychometrische eigenschappen van de tests dus afhankelijk van het type monster dat wordt gebruikt om ze te berekenen. Dit is een feit dat ook, althans gedeeltelijk, een oplossing vindt in de TRI-benadering.
De itemresponstheorie (TRI)
De theorie van respons op items (TRI) wordt geboren als een aanvulling op de theorie van klassieke tests. Met andere woorden, de TCT en de TRI kunnen dezelfde test evalueren en een score of relevantie voor elk van de items vaststellen, wat ons op zijn beurt een ander resultaat voor elke persoon zou kunnen geven. Aan de andere kant, om erop te wijzen dat de TRI ons een veel beter gecalibreerd instrument zou geven, is het probleem dat dit paradigma veel hogere kosten en de deelname van gespecialiseerde professionals heeft..
De TRI heeft verschillende aannames, maar misschien wel de belangrijkste vertelt ons dat elk meetinstrument in overeenstemming moet zijn met een idee: er is een functionele relatie tussen de waarden van de variabele die de items meten en de kans om deze te raken. Deze functie wordt genoemd Karakteristieke curve van het item (CCI). Wat veronderstellen we dan??
Welnu, iets dat van buitenaf heel logisch lijkt en dat de TCT niet evalueert. De moeilijkste items zijn bijvoorbeeld diegene die alleen de slimste mensen antwoorden. Aan de andere kant is een item dat door alle mensen goed wordt beantwoord, voor ons niet de moeite waard omdat het geen enkele macht heeft om te discrimineren. Met andere woorden, het zou geen enkele vorm van informatie geven. Dit is slechts een kleine schets van de revolutie voorgesteld door de TRI.
Om de verschillen tussen het ene meetmodel en het andere enigszins te kunnen zien, kunnen we de tabel van José Muñiz (2010) als volgt weergeven:
Tabel 1. Verschillen tussen de TCT en de TRI (Muñiz, 2010)
aspecten | TCT | TRI |
model | lineair | niet-lineaire |
aannames | Zwak (gemakkelijk te ontmoeten voor de gegevens) | Sterk (moeilijk te bereiken door gegevens) |
Meetinvariantie | niet | ja |
Invariantie van testeigenschappen | niet | ja |
Schaal van scores | Tussen 0 en het maximum in de test | oneindigheid |
nadruk | test | item |
Item-test relatie | Niet gespecificeerd | Karakteristieke curve van het item |
Beschrijving van de items | Difficulty and Discrimination-indexen | Parameters a, b, c |
Meetfouten | Typische meetfout die gebruikelijk is voor het hele monster | Informatiefuncties (varieert naar gelang van het niveau van geschiktheid) |
Voorbeeldgrootte | Het kan ongeveer bij ongeveer 200 tot 500 proefpersonen goed werken | Meer dan 500 onderwerpen worden aanbevolen |
Dit is hoe beide theorieën van de tests gerelateerd zijn. Hoewel het bijna gelijktijdig is, lijkt het duidelijk dat TRI is geboren als reactie op de beperkingen of problemen die TCT kan ontwikkelen. Het lijkt echter duidelijk dat onderzoek nog een lange weg te gaan heeft op dit gebied van psychometrie..
Psychologische tests: kenmerken en functioneren De psychologische tests zijn de instrumenten die in de psychologie worden gebruikt om de variabelen te meten die geïnteresseerd zijn in weten. Meer lezen "