Close

Crash-test sur la reproductibilité de la recherche en biologie

Nid de mésanges bleues (« cyanistes caeruleus »), en Alsace, en mai 2019. Parmi 135 études, la majorité, mais pas toutes, a conclu qu’il existe un lien entre le nombre d’oisillons dans une couvée et leur poids. Mais la force de la relation mise en évidence varie de un à dix.

Des écologues viennent de jeter un pavé dans la mare de leur discipline, sous forme d’un manuscrit en cours de publication dans la revue BMC Biology et mis en ligne le 4 octobre. Plus de deux cents chercheurs ont analysé exactement les mêmes données pour arriver à des conclusions… différentes, voire parfois opposées.

Dans un lot de 135 analyses, la majorité trouve que plus il y a d’oisillons dans une couvée de mésanges bleues, moins le poids de chacun est grand. Mais la force de la relation entre nombre de petits et poids varie d’un à dix. Dans un autre lot, de 81 analyses, une partie trouve que l’enherbement d’une parcelle nuit à la croissance des eucalyptus, quand une autre partie trouve le contraire. Les trois quarts trouvent que l’occupation des sols par l’herbe n’a pas d’effets.

La recherche en écologie serait-elle à ce point fragile ? « Depuis plus de dix ans, je m’intéresse à la fiabilité de la littérature scientifique en écologie et biologie de l’évolution, explique Hannah Fraser, copilote de cette expérience inédite à l’université de Melbourne (Australie). On impute souvent la variabilité des résultats au fait que les conditions environnementales ne sont jamais exactement les mêmes. Mais nous voulions savoir à quel point les décisions individuelles dans l’analyse de données peuvent influencer également cette variabilité. »

Cela peut sembler étonnant, mais devant un jeu de données, chaque chercheur fait des choix différents en fonction de ce qui lui paraît pertinent. Il peut, par exemple, ne garder que certaines observations. Dans le cas « mésanges », il y avait des mesures faites dans la nature, mais aussi d’autres, où des oisillons étaient ajoutés ou ôtés par des humains pour étudier l’évolution de la portée.

Ensuite, il faut tenir compte des facteurs susceptibles d’influencer la relation cherchée entre deux variables. Dans le cas « eucalyptus », la distance de la parcelle à un arbre mature susceptible de faire tomber des graines compte évidemment pour estimer les chances de croissance d’un arbre. Sélectionner ces cofacteurs ajoute encore des options.

« Une variabilité surprenante »

Enfin, il y a le choix des méthodes statistiques. Une relation linéaire entre deux variables, ou une autre, plus subtile ? Un point de vue fréquentiste ou bayésien (le nom de deux écoles statistiques) ? Quelle version de logiciel pour estimer les paramètres ? Encore des sources de variabilité.

Pour éclairer la situation, les auteurs ont été méthodiques. Deux jeux de données, « mésange » et « eucalyptus », ont été proposés, avec pour chacun une question précise, jamais étudiée jusque-là. Chaque « analyste » est ensuite devenu relecteur critique du travail des autres, attribuant une note de 0 à 100.

Il vous reste 50% de cet article à lire. La suite est réservée aux abonnés.

source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

0 Comments
scroll to top