Close

Recherche : un trafic de fausses références bibliographiques découvert

Vie des labos. Certains scientifiques sont prêts à tout pour gonfler leur CV, comme en témoigne une nouvelle magouille, découverte par un groupe de « détectives » de la science.

L’adage « Publier ou périr » résume l’importance prise par les publications pour évaluer la qualité d’un chercheur. Le nombre d’articles compte, mais aussi le nombre de fois où un article est cité par d’autres, c’est-à-dire mentionné dans la liste des références bibliographiques accompagnant chaque article de recherche. Depuis les années 1960, le décompte des citations est à la source d’énormément d’indicateurs renseignant sur la notoriété des journaux (tel le facteur d’impact), ou sur la célébrité d’un chercheur ou d’une université (comme le classement de Shanghaï, l’indice h…).

Ces mesures ont pris une telle importance qu’elles ont stimulé la créativité pour les enjoliver. Certains chercheurs s’autocitent plus que de raison. D’autres ont aussi constitué des « cartels » : on cite des auteurs qui vous citent en retour. Les tricheries sont si répandues que l’entreprise Clarivate, spécialisée dans ces indicateurs et qui produit le classement des « chercheurs très cités », a, depuis deux ans, fait le ménage dans sa liste : 300 chercheurs enlevés en 2021, 500 en 2022 et plus de 1 000 dans son édition du 15 novembre.

Une faille de taille

Toutefois, la dernière tromperie sort du lot. « Jusqu’à présent, les manipulations se faisaient au niveau des articles. La liste des citations était plus ou moins polluée. Là, nous avons trouvé des citations qui sont comptées mais qui n’existent pas ! », indique Cyril Labbé, professeur d’informatique à l’université Grenoble-Alpes, auteur avec Lonni Besançon, Guillaume Cabanac et Alexander Magazinov du preprint découvrant le pot aux roses.

Comment a-t-on pu recenser des citations invisibles, ou « fantômes », selon leur expression ? En réalité, les différents pourvoyeurs d’indicateurs, comme les bases de données Dimensions, The Lens, ou les entreprises Elsevier, Clarivate, Google, sont clientes d’une organisation tierce américaine à but non lucratif, Crossref. Celle-ci récolte les métadonnées de tous les articles fournies par les plus de 20 000 éditeurs membres : titres, dates, auteurs, références. Mais il n’y a pas de contrôle pour vérifier que ces données correspondent bien aux articles !

Ainsi, les limiers ont, par exemple, trouvé une publication avec 27 références dans sa version originale, mais 108 selon Crossref. Au total, pour 3 200 articles de trois journaux analysés par l’équipe, il y avait plus de 65 800 références, dont 5 978 étaient présentes dans Crossref mais pas dans les articles, soit 9 % du total. « C’est tellement surréaliste que ça m’a fait un peu rire, même si d’autres peuvent trouver cela assez inquiétant », constate Cyril Labbé.

Il vous reste 40% de cet article à lire. La suite est réservée aux abonnés.

source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

0 Comments
scroll to top