ControverSciences est archivé. Il reste consultable mais il n'est plus possible de contribuer.
Le code source pour faire tourner le serveur reste disponible sur GitHub.
Titre de la review

Problèmes émergents de la qualité des données en science citoyenne

Résumé de la review

Les projets scientifiques impliquant des citoyens peuvent porter sur des questions spécifiques de recherche , avec des protocoles précis de collecte de données, ou sur des questions plus ouvertes, menant à des collectes de données parfois inconnues ou en évolution. Les avancées technologiques ont considérablement contribué à l’accroissement du nombre de projet de science citoyenne. Dans cette revue, les auteurs s’intéressent aux projets en ligne, appelés « crowdsourcing », afin de discuter autour de la qualité des données.

Le projet Galaxy zoo démontre, à travers la création d’un forum, une conception permettant aux participants de fournir de nouvelles informations précieuses et de contribuer au-delà de la simple classification d’images de galaxies. Les auteurs affirment que la qualité des données en science citoyenne correspond à bien plus que l’exactitude des données.

Selon Lewandowski et Specht (2015), la qualité des données dans le cadre de projet de science citoyenne axée sur la biologie peut être décrit par quatre dimensions : l’exactitude et la précision des données ; une taille suffisante de l’échantillon ; et des procédures d’échantillonnages normalisés. La qualité des données recueillies par les citoyens semble devoir répondre à des critères correspondant aux normes de la science professionnelle. Cependant, selon ces auteurs, les citoyens manquent généralement de formation scientifique formelle et ces lacunes causent des soucis pour la collecte de données.

La qualité des données indique également dans quelle mesure la conception d’un projet spécifique facilite la capacité des citoyens à repérer les éléments intéressants, inattendus ou nouveaux. Les auteurs mettent en avant le fait qu’il faudrait considérer le manque d’expérience et le manque de formation scientifique formelle comme des caractéristiques améliorant la qualité des données et non comme des « menaces », à condition que les chercheurs sachent en tirer parti. De plus, les participants des projets de science citoyenne ne forment pas un groupe homogène mais sont plutôt constitués de « communautés », avec des intérêts spécifiques, des formations et expertises diverses. Cette vision est dominante dans certains domaines tel que celui de l’informatique ; la qualité des données est ainsi perçue comme un système multidimensionnel. Des compromis semblent tout de même inévitables. A travers l’exemple du projet eBird, où les participants nécessiteraient une expertise pour participer, les auteurs mettent en avant la présence de compromis entre participation à large échelle et les attentes des sponsors envers de citoyens novices. L’exhaustivité des données est parfois compromise volontairement afin d’accroitre la précision des données.

Les auteurs soutiennent le fait qu’il faut impliquer une large diversité de citoyens dans les projets de science citoyenne, ces derniers devant être conçus de manière inclusive et non limités. Il semble même que ce type de projet permette d’obtenir davantage d’observation et pas seulement celles prédéterminées : ils mettent en avant une approche flexible de la collecte de données. Ce type d’approche permet d’avoir l’occasion d’établir des dialogues avec des personnes ayant pour objectif principal d'augmenter leur culture scientifique. Ils mettent aussi en avant le fait que les tâches peuvent souvent être irréalistes. D’après les auteurs, pour éviter les problèmes émergeants de la qualité des données issues de projet de science citoyenne, les citoyens doivent contribuer à la "rédaction de l'histoire" du projet.

Rigueur de la review

Bien qu'il soit utile que les citoyens participants aux projets de science citoyenne adhèrent aux normes de la pratique scientifique, le processus de la science comprend plus que la simple collecte et le traitement de données : la qualité des données est essentielle. Cependant, les auteurs mettent en avant leurs opinions en privilégiant les informations confirmants leurs idées ce qui peut induire, selon moi, un biais de confirmation.

Ce que cette review apporte au débat

Cette revue permet d'obtenir un point de vue différent concernant la qualité des données, qui n'est pas définie que par un seul critère mais qui correspond à un système multidimensionnel. De plus, il semblerait qu'ouvrir au maximum la question du projet permette d'impliquer et de motiver davantage les citoyens.

Publiée il y a plus de 7 ans par C. Mayeux et D. Lutgen.
Dernière modification il y a plus de 7 ans.
Review : Emerging problems of data quality in citizen science