Q.I. or not Q.I. ? L’identification du surdon (6 / 12 ) – Les échelles de Wechsler : des qualités psychométriques non valables pour les HP

Par Stéphanie Aubertin – Neuropsychologue.

Le précédent billet traitait de la psychométrie des échelles de Wechsler. Nous avons vu que de nombreux « arrangements » (selon le terme de Lautrey, 2007) ont été réalisés lors de la construction du test et de son étalonnage de manière à ce que les performances de la population obéissent à la loi normale, et en accord avec l’existence d’un facteur g.  Néanmoins, est-ce que toute la population répond à ces mêmes spécificités psychométriques ?

1.    Sensibilité

La sensibilité d’un test est sa qualité à bien différencier les individus entre eux.

1.1    Effet plafond

Il est fréquent de constater que les personnes à HP « réussissent » tous les items d’un ou de plusieurs subtests. C’est ce que l’on appelle l’effet plafond.
En fait, l’étalonnage tel qu’il a été construit ne fournit pas une étendue des scores suffisante pour mesurer correctement  le niveau intellectuel des personnes présentant des compétences extrêmes.
A l’origine de cet effet, on trouve des contraintes psychométriques généralement imposées lors de la construction du test :
–    L’étalonnage est construit de manière à représenter la population, c’est-à-dire des personnes “tout-venant”. Autrement dit, il est construit de manière à ce que les sujets se répartissent selon le modèle théorique de la loi normale. Et d’après cette loi normale, il y a peu de sujets extrêmes. Il y aurait ainsi au sein de l’échantillon d’étalonnage moins de 3 enfants par tranche d’âge qui ont un QI > 130 (selon Virgnaud, 2002, cité par Caroff, à propos du WISC III).
Donc, lorsqu’un enfant à HP (ou un adulte, car l’étalonnage de la WAIS est réalisé de la même manière) passe un test, il est comparé aux performances de seulement 3 enfants à HP.
Ainsi son QI peut passer par exemple de 140 à 157 avec très peu de différences de performances.
–    Les items des différents subtests sont construits de manière à différencier la majorité de la population. Ils doivent donc être ni trop faciles, ni trop difficiles. Or, l’estimation de la difficulté d’un item dépend des caractéristiques de la population sur laquelle elle a été calculée (Caroff, 2006), ici donc sur des sujets “tout venant”. Il est donc logique que les items revêtent un caractère plutôt facile pour les personnes à HP.

1.2    Effet Flynn

Cet effet désigne une augmentation régulière du QI à travers les générations.
Flynn (1984) a remarqué qu’en faisant passer deux versions d’un même test à des sujets (versions étalonnées à deux périodes différentes), les sujets avaient de meilleures notes pour la version du test dont l’étalonnage était le plus ancien. Le gain de QI correspondait à 1/3 de point par année pour des sujets américains “tout-venant”.
Larrabee et Holroyd (1976) ont également retrouvé cet effet chez les enfants à HP. Ils ont constaté que le QI global au WISC première version était supérieur de plus de 10 points à celui obtenu au WISC-R (deuxième version du test).
C’est en partie pour cette raison que les étalonnages sont régulièrement remis à jour sous peine de devenir obsolètes.

2.    Fidélité

Pour toute mesure psychologique, le score obtenu est constitué d’un score vrai ET d’une erreur de mesure. L’erreur de mesure altère de manière aléatoire la note observée par rapport au score vrai. Il est donc important de connaître cette erreur pour chaque test.

Pour cela, on réplique la mesure dans les mêmes conditions de passation (technique du test-retest) mais avec un temps suffisamment long pour éviter tout effet apprentissage, et on analyse les corrélations entre les deux résultats. Le test est d’autant plus fidèle si cette corrélation tend vers 1.

A des enfants à HP, Ellsey et Karnes (1990) ont fait passer  deux fois la version révisée du WISC (le WISC-R) à 1 ou 2 ans d’intervalle. Les résultats montrent que les QI corrèlent assez peu entre ces deux mesures : les corrélations sont de 0,49 pour le QIT, 0,33 pour le QI verbal et 0,57 pour le QI performance, alors qu’elles sont de 0,90 pour les enfants “tout-venant”.
Ceci signifie que si on fait passer le test une seconde fois à un enfant « tout venant », il obtiendra à peu près les mêmes résultats alors que les résultats d’un enfant à HP varieront énormément entre les deux passations.
Il est alors légitime de se poser deux questions :
1/ N’y aurait-il pas « autre chose » qui puisse expliquer l’absence de stabilité des performances ? Cette « autre chose » pouvant être quelque chose de cognitif, d’émotionnel, de relationnel etc…
2/ Est-ce que les tests mesurent bien ce qu’ils sont sensés mesurer ? C’est là le but des études de validité des tests :

3.    Validité

La validité est la capacité d’un outil à mesurer ce qu’il est sensé mesurer, selon l’utilisation que l’on veut en faire. Il existe plusieurs types de validité.
En ce qui concerne les enfants à HP, il a été démontré que (Caroff et al., 2006) :
–    L’Indice de Compréhension Verbale et l’Indice de Raisonnement Perceptif mesurent la même chose que pour les enfants “tout-venant”, mais pas l’Indice de Mémoire de Travail ni l’Indice de Vitesse de Traitement.
Il semblerait alors que d’autres choses entrent en ligne de compte pour ces deux derniers indices. De plus, tous les subtests comportant une limite de temps ne sont pas valides pour le diagnostic des enfants HP, notamment parce que vitesse de traitement neuronale n’implique pas forcément une vitesse psychomotrice (cf. à ce sujet la notion de dysynchronie intelligence-psychomotricité de Terrassier).
–     Les performances des enfants à HP aux différents tests d’intelligence (WISC, Matrices Progressives de Raven et le Standford-Binet) sensés tous mesurer le facteur g ne sont pas corrélées, alors que les corrélations sont généralement comprises entre 0,40 et 0,75 pour les enfants “tout-venant”.
En d’autres termes, si on teste un enfant « tout venant » avec le WISC, les Matrices de Raven ou le Standford-Binet, ses résultats (c’est-à-dire son classement par rapport aux autres enfants) seront équivalents. Par contre, les résultats d’un enfant à HP à l’ensemble de ces tests ne sont pas identiques et varient énormément. Il n’y aurait donc pas, pour ces enfants, de point commun (en l’occurrence le facteur g) entre ce qui est mesuré à travers tous ces tests.

Il apparaît donc que les échelles de Wechsler possèdent d’excellentes qualités psychométriques – sensibilité, fidélité et validité – pour une population “tout-venant” mais de piètres qualités psychométriques pour les personnes à Haut Potentiel.

4.    Alors, facteur g ou pas facteur g ?

Liratni (2009) propose de remettre en cause la notion théorique du facteur g, « non pas dans les zones normales, mais plutôt dans les zones extrêmes ». En effet, Detterman & Daniel (1989) ont mis en évidence que les corrélations avec le facteur g étaient plus fortes chez les personnes dont le QI est < 70 (chez les déficients intellectuels).
Ils en concluent qu’étant donné que le poids du facteur g n’est pas identique selon les niveaux intellectuels, son existence en tant qu’entité unique ne peut être pertinente. Ainsi, le facteur g serait davantage représentatif du déficit intellectuel que de l’intelligence dite normale. Liratni (2009) cite Facon (2003, 2004) qui s’appuie sur la « loi des rendements décroissants » de Spearman pour expliquer ce phénomène. Selon Facon, plus le QI est élevé, plus le poids du facteur g diminue, alors que le poids des facteurs spécifiques augmente.

Dans le prochain billet, j’analyserai plus en détail ce que mesure chaque subtest, c’est-à-dire la compétence qu’il est sensée mesurer AINSI QUE toutes les autres compétences ou paramètres qui entrent en ligne de compte.

Bibliographie

Caroff X., Guignard J-H., & Jilinska M. (2006) in Lubart T. (dir.), Enfants exceptionnels : précocité intellectuelle, haut potentiel et talent, Editions Bréal collection « Amphi Psychologie », Paris, 2006.

Detterman, D.K., & Daniel, M.H. (1989). Correlations of mental tests with each other and with cognitive variables are highest for low IQ groups. Intelligence, 13, 349-359.

Ellsey J.T. & Karnes F.A. (1990). Test-Retest stability of the WISC-R IQs among young gifted students. Psychological Reports, 66, 1023-1026.

Facon, B. (2003). Sur la loi des rendements décroissants. Efficience intellectuelle et facteur général. L’année Psychologique, 103, 81-102.

Facon, B. (2004). Are correlations between cognitive abilities highest in low-IQ groups during childhood ?. Intelligence, 32, 391-401.

Flynn, J.R. (1984). The mean IQ of Americans: A massive gains 1932 to 1978. Psychological Bulletin, 95, 29-51.

Larrabee D. & Holroyd R.G. (1976). Comparison of WISC and WISC-R using a sample of highly intellectual children. Psychological Report, 38, 1071-1074.

Lautrey, J. (2007). Pour l’abandon du QI : les raisons du succès d’un concept dépassé. In

M. Duru-Bellat & M. Fournier (Eds.), L’intelligence de l’enfant – l’empreinte du social. Auxerre : Editions Sciences Humaines.

Liratni M. (2009). Enfants à haut potentiel intellectuel : Aspects cognitifs et socio-adaptatifs. Thèse de doctorat. Université de Montpellier III.

Vrignaud, P. (2002). L’identification des surdoués : chimère psychométrique ou réalité psychologique ? Communication présentée aux 15èmes Journées de Psychologie Différentielle, 10-13 septembre, Rouen.

10 thoughts on “Q.I. or not Q.I. ? L’identification du surdon (6 / 12 ) – Les échelles de Wechsler : des qualités psychométriques non valables pour les HP

  1. Concernant la vitesse et l’intelligence, un article très intéressant de Michel Chew sur Cogn-IQ (http://www.cogn-iq.org/archives/506). Je fais l’hypothèse pour ma part que l’Indice de Mémoire de Travail ne mesure pas du tout la même chose chez le « tout-venant » que chez le HP pour la simple raison que le HP n’utilise pas les mêmes « algorithmes » de traitement d’information. Je fais l’hypothèse également d’une manière générale que le HP, et notamment le HP-complexe, n’entretient pas la même relation à l’espace et au temps que le « tout-venant » et ne recherche donc pas les informations exactement de la même manière dans sa mémoire (question « d’indexation » de l’information en quelque sorte…). Mais je conviens ici que ces hypothèses ont besoin d’étayage…

    1. Merci Laurent de cet apport !

      Je conçois Talentdifferent comme un centre de ressources, une base qui permette de faire avancer le sujet HP.
      Alors, étayées ou pas, merci de nous avoir fait part de vos hypothèses : elles vont dans ce sens.

    2. Merci également Laurent !

      J’ai moi aussi des tonnes d’hypothèses, et je suis en train de réfléchir à un projet de thèse. Mais en fait, il faudrait plusieurs thèses pour tester mes hypothèses 🙂

      1. Laissez en à d’autres, Stéphanie !… Pour ma part, ce sont les hypothèses qui font « avancer » le débat et le questionnement qui va avec. Les réponses ne sont « que » des questions en quelque sorte, ce sont les maths qui m’ont appris çà et l’adage populaire « on ne trouve que ce que l’on cherche » : y voyez vous l’enfermement également, à savoir : on ne cherche que ce que l’on trouve ? Il y a un énorme écart entre les faits et leur interprétation par des modèles/théories et cet écart parle de l’observateur selon moi, de ses limites, de sa capacité à questionner, à raisonner, à chercher, à trouver et de son humilité devant les faits, devant la réalité. Aussi, modestement, je vous encourage à vous lancer dans votre première thèse, Stéphanie et peut-être, si cela vous est possible, vous pourrez et aurez envie de former ensuite d’autres thésards sur des sujets connexes ?
        Bien à vous,

    3. Je ne sais pas si c’est dans le sujet ou pas, mais j’ai un peu analysé la façon dont je mémorise certaines choses.

      Par exemple, j’ai toujours eu du mal avec les poésies, car elles ne présentent ni sens ni grand intérêt pour moi (même celles que je trouve belles). Par contre, j’ai une très bonne mémoire musicale ; ainsi, si je ne sais pas réciter « Le corbeau et le renard », je sais le chanter tel que je l’ai appris à la chorale (version Frères Jacques, je crois). Je pense que c’est sur ce principe qu’autrefois on faisait chantonner aux enfants l’alphabet, les tables d’opérations…

      J’ai une très mauvaise mémoire des noms (propres et communs). Par contre, une bonne mémoire des chiffres ; et pour en arriver au système d’indexation dont parle Laurent, je mémorise les n° de téléphone en indexant les nombres dans diverses cases : je sais où vivent les gens, donc les deux premiers chiffres sont dans une case liée à ce fait ; dans mon coin géographique, la plupart des n° commencent ensuite par deux ou trois séries de deux nombres, donc ça va dans une autre case (untel est lié à 61 27, telle autre à 34 66 etc.). Il ne me reste donc à mémoriser pour chaque personne que les quatre derniers chiffres, ce qui est aisé. 🙂

      Je ne sais pas si je suis très claire ?

      Je trouve souvent plus simple et plus rapide de retenir des séries de nombres plutôt que de m’embêter à chercher le papier où elles sont notées mais là, je ne sais pas trop comment c’est indexé (par ex., les seize chiffres de ma carte bleue dont j’ai eu besoin pour des achats en ligne). Chaque série de quatre chiffres est mémorisée selon une sorte de logique interne que je n’ai pas décryptée.

      J’avoue que j’aimerais avoir une meilleure mémoire de noms et des mots, car cette faiblesse me handicape souvent (dans la vie courante, et pour l’apprentissage des langues), quitte à moins bien mémoriser les chiffres (c’est rigolo, mais moins utile, je trouve).

      1. J’ai retenu de mes « leçons » sur la mémoire, qd j’étais étudiant, que pour mémoriser beaucoup de données, il semble nécessaire d’établir beaucoup de liens entre elles. Il y a l’analogie, connue, avec le récit narratif (ou la chanson comme vous le rapportez qui est d’une certaine manière un récit narratif) : chaque donnée à mémoriser occupe une place particulière dans le récit. Mais le récit a ses limites : il est séquentiel. En étudiant des algorithmes de classement d’informations (gestion de base de données par exemple), il est possible d’y voir des analogies utiles pour le quotidien, notamment l’idée que chaque donnée peut être incluse/répertoriée par un grand nombre de « champs ». + ce nombre est élevé et + la mémorisation est aisée. C’est un peu l’idée du nombre d’occurrences mise en œuvre par un moteur de recherches, par exemple. La pertinence d’une réponse est ainsi corrélée à ce nombre d’occurrence. La limite de ce procédé est qu’elle opacifie en quelque sorte les « signaux faibles », pourtant parfois prometteurs dans les résultats.
        Enfin, concernant les HP, je conjecture une analogie avec le concept de synesthésie : prendre en compte 5 champs principaux (avec de multiples variables pour chacun..) d’indexation d’une donnée. Ainsi, schématiquement, à une donnée particulière est associée une « matrice » de variables multiples, incluant bien évidemment non seulement l’espace mais aussi le temps… Cela semble compliqué comme cela mais demandez à un œnologue ou à un « nez » ce qu’il en pense, lui qui peut se souvenir d’un parfum ou d’un vin de multiples manières, dans l’espace et ds le temps (multiples dégustations….), de ses formes visuelles, auditives (pourquoi pas le contexte d’une dégustation ?), gustatives, odorantes, tactiles, ainsi que les contextes singuliers et spécifiques des dégustations (lieu, climat, personnes, époque de l’année, année etc…)…
        bien à vous,

        1. Deux ans plus tard (ce n’est plus un escalier, à ce stade-là)… je pense en effet que ma mémoire fonctionne sur le modèle décrit par Laurent : à chaque donnée est associée une matrice de variables multiples. Je ne saurais pas décrire plus précisément mais cette image me semble bien correspondre à mes dernières observations. Du coup, un truc trop « simple » comme un mot a du mal à être mémorisé parce que la matrice est incomplète ?

          Par ailleurs, j’ai écrit précédemment que j’avais une bonne mémoire des chiffres, ce qui est faux (un chiffre ou une suite de chiffres n’ont pour moi aucun sens ou la matrice est incomplète), ce sont les nombres que je mémorise assez facilement, pour les raisons précédemment expliquées.

          Il me semble d’ailleurs que les choses complexes sont plus faciles à retenir ou à faire que les choses simples, parce qu’il y a davantage de repères ? Serait-ce également une caractéristique des personnes à haut potentiel ?

          Je relis la série des articles de Stéphanie Aubertin et les apprécie toujours autant, ils sont excellents.

  2. C’est vraiment intéressant. Je ne découvre pas tout parce que j’avais quelques notions sur le sujet mais ça complète grandement mes connaissances. Merci

  3. Merci Stéphanie, pour ce billet qui commence à répondre à mes multiples interrogations 🙂
    J’attends la suite avec toujours autant d’intérêt (et d’impatience).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *