Les utilisateurs de Microsoft Teams pourront bientôt utiliser des versions clonées de leurs voix pour parler et traduire des conversations en temps réel, alors que l’entreprise dévoile son nouvel outil d’interprétation alimenté par l’IA.
Annoncé lors de la conférence annuelle Microsoft Ignite et rapporté par TechCrunch, cette nouvelle fonctionnalité permet aux utilisateurs de créer des répliques numériques de leurs voix qui peuvent ensuite être utilisées pour traduire leur discours dans plusieurs langues. “Imaginez pouvoir sonner exactement comme vous dans une langue différente. L’outil d’interprétation dans Teams fournit une traduction vocale en temps réel pendant les réunions, et vous pouvez opter pour qu’il simule votre voix pour une expérience plus personnelle et engageante,” a écrit le CMO de Microsoft, Jared Spataro, dans un article de blog partagé avec la publication.
Instagram permettra aux utilisateurs de “réinitialiser” leur contenu recommandé
La fonctionnalité sera uniquement disponible pour les abonnés de Microsoft 365, et sera lancée initialement pour l’anglais, le français, l’allemand, l’italien, le japonais, le coréen, le portugais, le chinois mandarin et l’espagnol.
L’outil d’interprétation de Microsoft a le potentiel de rendre le travail à distance et la socialisation numérique plus accessibles à un plus large éventail de personnes ne parlant pas anglais, bien qu’il ne soit pas encore aussi dynamique qu’un traducteur humain en direct. Et au-delà de son application explicite, l’outil soulève encore plus de questions sur la sécurité et le biais technologique.
Une étude récente a révélé que l’outil de transcription populaire alimenté par l’IA, Whisper — également utilisé dans les programmes de cloud computing de Microsoft — était sujet à des hallucinations, y compris l’invention de contenu ou de phrases lors de la traduction d’informations sur des patients dans le domaine médical. Cela était particulièrement vrai pour les patients ayant des troubles de la parole comme l’aphasie. Le pin AI Humane précédemment vanté, annoncé pour ses capacités de traduction en direct, s’est avéré être une alternative numérique inconsistante à la traduction humaine. Pour répondre à des préoccupations similaires concernant l’interprétation de Teams, Microsoft a déclaré à TechCrunch : “L’outil d’interprétation est conçu pour reproduire le message du locuteur aussi fidèlement que possible sans ajouter d’hypothèses ou d’informations superflues. La simulation vocale ne peut être activée que lorsque les utilisateurs donnent leur consentement via une notification pendant la réunion ou en activant le ‘consentement à la simulation vocale’ dans les paramètres.”
La technologie pourrait avoir d’immenses implications dans le domaine de l’accessibilité, avec des personnalités notables comme la représentante américaine Jennifer Wexton amplifiant l’utilisation du clonage vocal personnalisé de haute technologie pour les personnes ayant des difficultés d’élocution atypiques. Mais cela a également suscité des préoccupations concernant les utilisations non consensuelles de deepfake et le potentiel de la technologie en tant qu’outil dans l’arsenal des escrocs. La technologie de clonage vocal AI puissante — celle de Microsoft étant apparemment impressionnante et ressemblant à celle d’un humain — a soulevé des préoccupations éthiques, le PDG de Microsoft appelant à des garde-fous plus stricts et à une gouvernance de l’IA face à l’augmentation des deepfakes de célébrités.
Cependant, l’engouement autour du clonage vocal, renforcé par la folie de l’IA, n’a fait que croître parmi les innovateurs de l’industrie, s’ajoutant aux investissements antérieurs dans la traduction de la parole en texte par l’IA. L’année dernière, Apple a annoncé sa fonctionnalité de voix personnelle, un outil d’apprentissage automatique qui crée une version synthétisée de la voix d’un utilisateur pouvant être utilisée dans des situations de texte à parole en direct, comme FaceTime, et était annoncé comme une accessibilité. Microsoft a dévoilé sa propre fonctionnalité de voix personnelle à peu près au même moment, alimentée par son IA Azure et disponible en 90 langues.
Laisser un commentaire