Une récente publication scientifique (Dubus et al., 2024) expose comment les sciences participatives peuvent être utilisées pour améliorer la détection automatique des vocalisations de cétacés grâce à des modèles d’intelligence artificielle (IA).

Contexte et enjeux

La surveillance par acoustique passive (PAM) est une méthode qui permet de suivre les cétacés en enregistrant leurs sons sous l’eau. Cependant, ces enregistrements génèrent un volume considérable de données qu’il faut analyser. Pour cela, les chercheurs utilisent des modèles d’IA basés sur l’apprentissage profond (deep learning). Or, ces modèles ont besoin de données bien annotées (c’est-à-dire des enregistrements où l’on sait exactement où se trouvent les sons des cétacés), et ces annotations sont généralement réalisées par des experts. Cependant, comme les spécialistes dans ce domaine sont relativement rares, le processus d’annotation peut être long. L'objectif de cette étude est ainsi de déterminer si le recours à des annotations provenant des sciences participatives pourrait représenter une alternative efficace à l'annotation effectuée par un expert.

Implication des citoyens et variabilité des annotations

L’étude a impliqué 19 volontaires novices et un expert pour annoter des enregistrements de vocalisations de baleines bleues dans l’océan Indien. Les chercheurs ont constaté que les annotations des novices varient en fonction de leur approche : certains sont plus conservateurs (ne marquant que les sons dont ils sont sûrs), tandis que d’autres sont plus permissifs (marquant plus de sons, mais avec un risque accru d’erreur). Pour évaluer cette variabilité, des modèles de réseaux de neurones ont été entraînés avec ces annotations et testés sur d’autres bases de données.

Résultats et solutions proposées

Les résultats montrent que les modèles entraînés uniquement avec des annotations de novices présentent des performances plus variables, mais que celles-ci peuvent être améliorées en combinant plusieurs annotations (méthode du "vote majoritaire") ou en utilisant des labels "flous" (soft labeling), qui tiennent compte des désaccords entre annotateurs. Avec suffisamment d'annotations agrégées (10 à 13 personnes), les modèles obtenus rivalisent avec ceux entraînés à partir des annotations d’experts.

Conclusion

L’étude met en évidence l’intérêt de la science participative pour enrichir les bases de données nécessaires à l’apprentissage des modèles d’IA. En impliquant des citoyens et en appliquant des stratégies d’agrégation des annotations, il est possible d’obtenir des modèles performants sans nécessiter une annotation systématique par des experts, rendant ainsi la surveillance des cétacés plus efficace et accessible !

Merci aux auteurs pour cette formidable étude démontrant l’utilité des sciences participatives dans l’amélioration de la détection automatique des vocalisations de cétacés : Gabriel Dubus (Sorbonne Université & ENSTA), Dorian Cazau (ENSTA), Maëlle Torterotot (ENSTA), Anatole Gros-Martial (ENSTA, CEBC & Université de Brest), Paul Nguyen Hong Duc (Centre for Marine Science and Technology), Olivier Adam (Sorbonne Université).

article garbiel.pdf

Dubus, G., Cazau, D., Torterotot, M., Gros-Martial, A., Duc, P. N. H., & Adam, O. (2024). From citizen science to AI models: Advancing cetacean vocalization automatic detection through multi-annotator campaigns. Ecological Informatics81, 102642.

Soutenance de thèse de Gabriel Dubus :

https://www.youtube.com/live/qaMgAJdu1vM