En 2025, nous verrons l’IA et l’apprentissage automatique exploités pour réaliser de réels progrès dans la compréhension de la communication animale, répondant à une question qui a intrigué les humains aussi longtemps que nous existons : « Que se disent les animaux ? » Le récent prix Coller-Dolittle, offrant des prix en espèces allant jusqu’à un demi-million de dollars pour les scientifiques qui « décodent le code », est une indication d’une confiance optimiste que les récents développements technologiques en apprentissage automatique et en modèles de langage de grande taille (LLM) placent cet objectif à portée de main.
De nombreux groupes de recherche travaillent depuis des années sur des algorithmes pour donner sens aux sons animaux. Le projet Ceti, par exemple, a décodé les trains de clics des cachalots et les chants des baleines à bosse. Ces outils modernes d’apprentissage automatique nécessitent des quantités de données extrêmement importantes, et jusqu’à présent, de telles quantités de données de haute qualité et bien annotées ont fait défaut.
Considérons des LLM tels que ChatGPT qui disposent de données d’entraînement comprenant l’intégralité des textes disponibles sur Internet. De telles informations sur la communication animale n’étaient pas accessibles dans le passé. Ce n’est pas seulement que les corpus de données humaines sont de nombreux ordres de grandeur plus importants que le type de données auquel nous avons accès pour les animaux dans la nature : Plus de 500 Go de mots ont été utilisés pour entraîner GPT-3, contre juste un peu plus de 8 000 « codas » (ou vocalisations) pour l’analyse récente de la communication des cachalots par le projet Ceti.
De plus, lorsqu’il s’agit de travailler avec le langage humain, nous savons déjà ce qui est dit. Nous savons même ce qui constitue un « mot », ce qui est un énorme avantage par rapport à l’interprétation de la communication animale, où les scientifiques ne savent que très rarement si un hurlement particulier de loup, par exemple, signifie quelque chose de différent d’un autre hurlement de loup, ou même si les loups considèrent un hurlement comme étant en quelque sorte analogue à un « mot » dans le langage humain.
Néanmoins, 2025 apportera de nouvelles avancées, tant en termes de quantité de données de communication animale disponibles pour les scientifiques qu’en ce qui concerne les types et la puissance des algorithmes d’IA qui peuvent être appliqués à ces données. L’enregistrement automatique des sons animaux est désormais facilement accessible à chaque groupe de recherche scientifique, avec des dispositifs d’enregistrement à faible coût tels que l’AudioMoth explosant en popularité.
Des ensembles de données massifs sont maintenant accessibles en ligne, car des enregistreurs peuvent être laissés sur le terrain, écoutant les appels des gibbons dans la jungle ou des oiseaux dans la forêt, 24 heures sur 24, 7 jours sur 7, sur de longues périodes. Il y a eu des occasions où de tels ensembles de données massifs étaient impossibles à gérer manuellement. Maintenant, de nouveaux algorithmes de détection automatique basés sur des réseaux neuronaux convolutifs peuvent parcourir des milliers d’heures d’enregistrements, en isolant les sons animaux et en les regroupant en différents types, selon leurs caractéristiques acoustiques naturelles.
Une fois que ces grands ensembles de données animales sont disponibles, de nouveaux algorithmes analytiques deviennent possibles, comme l’utilisation de réseaux neuronaux profonds pour trouver des structures cachées dans des séquences de vocalisations animales, qui peuvent être analogues à la structure significative dans le langage humain.
Cependant, la question fondamentale qui reste floue est de savoir ce que nous espérons réellement faire avec ces sons animaux ? Certaines organisations, comme Interspecies.io, définissent son objectif assez clairement comme étant de « transduire des signaux d’une espèce en signaux cohérents pour une autre ». En d’autres termes, traduire la communication animale en langage humain. Pourtant, la plupart des scientifiques s’accordent à dire que les animaux non humains n’ont pas de véritable langue à eux — du moins pas de la manière dont nous, humains, avons le langage.
Le prix Coller Dolittle est un peu plus sophistiqué, recherchant un moyen de « communiquer avec ou déchiffrer la communication d’un organisme ». Déchiffrer est un objectif légèrement moins ambitieux que traduire, considérant la possibilité que les animaux n’aient peut-être pas, en fait, une langue qui puisse être traduite. Aujourd’hui, nous ne savons pas exactement combien d’informations, ou combien peu, les animaux transmettent entre eux. En 2025, l’humanité aura le potentiel de dépasser notre compréhension non seulement de combien les animaux s’expriment, mais aussi de ce qu’ils se disent exactement.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.
Laisser un commentaire