Une personne en silhouette tient un téléphone affichant le logo bleu de Microsoft Teams.Les utilisateurs de Microsoft Teams pourront bientôt utiliser des versions clonées de leurs voix pour parler et traduire des conversations en temps réel, alors que l’entreprise dévoile son nouvel outil d’interprétation alimenté par l’IA.

Annoncé lors de la conférence annuelle Microsoft Ignite et rapporté par TechCrunch, cette nouvelle fonctionnalité permet aux utilisateurs de créer des répliques numériques de leurs voix qui peuvent ensuite être utilisées pour traduire leur discours dans plusieurs langues. “Imaginez pouvoir sonner exactement comme vous dans une langue différente. L’outil d’interprétation dans Teams fournit une traduction vocale en temps réel pendant les réunions, et vous pouvez opter pour qu’il simule votre voix pour une expérience plus personnelle et engageante,” a écrit le CMO de Microsoft, Jared Spataro, dans un article de blog partagé avec la publication.

VOIR ÉGALEMENT :

Instagram permettra aux utilisateurs de “réinitialiser” leur contenu recommandé

La fonctionnalité sera uniquement disponible pour les abonnés de Microsoft 365, et sera lancée initialement pour l’anglais, le français, l’allemand, l’italien, le japonais, le coréen, le portugais, le chinois mandarin et l’espagnol.

L’outil d’interprétation de Microsoft a le potentiel de rendre le travail à distance et la socialisation numérique plus accessibles à un plus large éventail de personnes ne parlant pas anglais, bien qu’il ne soit pas encore aussi dynamique qu’un traducteur humain en direct. Et au-delà de son application explicite, l’outil soulève encore plus de questions sur la sécurité et le biais technologique.

Une étude récente a révélé que l’outil de transcription populaire alimenté par l’IA, Whisper — également utilisé dans les programmes de cloud computing de Microsoft — était sujet à des hallucinations, y compris l’invention de contenu ou de phrases lors de la traduction d’informations sur des patients dans le domaine médical. Cela était particulièrement vrai pour les patients ayant des troubles de la parole comme l’aphasie. Le pin AI Humane précédemment vanté, annoncé pour ses capacités de traduction en direct, s’est avéré être une alternative numérique inconsistante à la traduction humaine. Pour répondre à des préoccupations similaires concernant l’interprétation de Teams, Microsoft a déclaré à TechCrunch : “L’outil d’interprétation est conçu pour reproduire le message du locuteur aussi fidèlement que possible sans ajouter d’hypothèses ou d’informations superflues. La simulation vocale ne peut être activée que lorsque les utilisateurs donnent leur consentement via une notification pendant la réunion ou en activant le ‘consentement à la simulation vocale’ dans les paramètres.”

La technologie pourrait avoir d’immenses implications dans le domaine de l’accessibilité, avec des personnalités notables comme la représentante américaine Jennifer Wexton amplifiant l’utilisation du clonage vocal personnalisé de haute technologie pour les personnes ayant des difficultés d’élocution atypiques. Mais cela a également suscité des préoccupations concernant les utilisations non consensuelles de deepfake et le potentiel de la technologie en tant qu’outil dans l’arsenal des escrocs. La technologie de clonage vocal AI puissante — celle de Microsoft étant apparemment impressionnante et ressemblant à celle d’un humain — a soulevé des préoccupations éthiques, le PDG de Microsoft appelant à des garde-fous plus stricts et à une gouvernance de l’IA face à l’augmentation des deepfakes de célébrités.

Cependant, l’engouement autour du clonage vocal, renforcé par la folie de l’IA, n’a fait que croître parmi les innovateurs de l’industrie, s’ajoutant aux investissements antérieurs dans la traduction de la parole en texte par l’IA. L’année dernière, Apple a annoncé sa fonctionnalité de voix personnelle, un outil d’apprentissage automatique qui crée une version synthétisée de la voix d’un utilisateur pouvant être utilisée dans des situations de texte à parole en direct, comme FaceTime, et était annoncé comme une accessibilité. Microsoft a dévoilé sa propre fonctionnalité de voix personnelle à peu près au même moment, alimentée par son IA Azure et disponible en 90 langues.

Share this post

Articles similaires

21 NOVEMBRE 2024

Ridley Scott et Fede Álvarez analysent le Xénomorphe dans un clip exclusif des coulisses d’Alien : Romulus

Regardez Ridley Scott et Fede Álvarez analyser le Xénomorphe dans ce clip exclusif des coulisses de "Alien: Romulus". "Alien: Romulus" est disponible à l'achat en numérique le 15 octobre et en Blu-Ray le 3 décembre.

0

21 NOVEMBRE 2024

Le département de la Justice confirme qu’il veut que Google se débarrasse de Chrome

Le ministère américain de la Justice (DoJ) a publié un document de 23 pages appelant à la scission de Google, y compris une vente du navigateur web Chrome et des restrictions sur Android, confirmant des rapports précédents. Vendre Chrome "mettra fin de manière permanente au contrôle de...

0

21 NOVEMBRE 2024

Lighthouse, un fournisseur d’analytique pour le secteur de l’hôtellerie, s’illumine avec 370...

Nous avons encore un autre signe de l'essor de l'industrie du voyage : une levée de fonds majeure par l'une des startups B2B servant ce secteur. Lighthouse, une plateforme d'analyse de données pour les hôtels et d'autres acteurs de l'industrie hôtelière, a clôturé un tour de série C de 370...

0

20 NOVEMBRE 2024

La magie de l’amour : Le casting de Hot Frosty parle d’acceptation et de l’esprit des fêtes

Lacey Chabert et Dustin Milligan partagent comment Hot Frosty mélange humour, coeur et magie des fêtes.

0

20 NOVEMBRE 2024

Black Friday 2024 : Meilleurs produits à acheter

Le plus grand jour de shopping de l'année approche à grands pas. Nous avons compilé une liste des meilleurs produits à acheter lors du Black Friday.

0

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.