Origine des données des intelligences artificielles
Les intelligences artificielles (IA) se nourrissent d’une vaste quantité de textes pour leur apprentissage. Ces textes proviennent non seulement de Wikipedia, mais aussi d’autres sources écrites. Parmi les éléments notables, on trouve une collection massive de près de 200 000 ouvrages compilée dans un projet appelé Books3, souvent sans l’accord de leurs auteurs. Ce phénomène soulève des questions essentielles concernant le droit d’auteur et le traitement des œuvres.
Argument du savoir universel
Certains partisans de ces systèmes conversants soutiennent que les données utilisées à des fins d’entraînement constituent un « savoir universel ». Ils affirment que, qu’elles soient protégées ou non, ces IA ne reproduisent pas les œuvres intégralement, mais en stockent uniquement des fragments d’informations. Cependant, cette affirmation est remise en question par des recherches récentes qui révèlent des aspects plus complexes de la situation.
Des études révélatrices
Une étude récente, menée par les chercheurs des universités de Stanford et de Yale, met en lumière le pouvoir des IA à restituer des textes protégés. Les chercheurs, dirigés par Ahmed Ahmed, ont réussi à faire réciter des pages entières de livres à quatre systèmes d’IA, en les isolant d’Internet afin d’éviter toute influence externe. Ce résultat soulève des interrogations sur les limites de la protection des droits d’auteur.
Des exemples emblématiques : « Harry Potter » et Proust
Dans le cadre de cette étude, l’IA dénommée Gemini 2.5 Pro a pu reproduire jusqu’à 77 % du texte du célèbre ouvrage Harry Potter à l’école des sorciers de J.K. Rowling. Cette performance a été obtenue en demandant à l’IA de compléter la première phrase, puis de continuer progressivement. De manière comparable, des essais ont permis de répliquer le premier paragraphe de Du côté de chez Swann de Marcel Proust, bien que l’IA ait fourni principalement des résumés pour des œuvres encore sous copyright.
Répercussions sur le monde littéraire
Ce phénomène de restitution des textes soulève des enjeux considérables pour le secteur littéraire. En particulier, des questions se posent concernant la protection des droits d’auteur, les pratiques des éditeurs et la manière dont les auteurs pourraient être compensés pour l’utilisation de leurs œuvres. Les implications de ces résultats pourraient potentiellement redéfinir le paysage de la création littéraire et des attentes de la part des lecteurs vis-à-vis des livres et des contenus accessibles.
Un débat qui se poursuit
Alors que les chercheurs continuent d’explorer le potentiel et les limites des intelligences artificielles, le débat sur leur utilisation des œuvres d’autrui ne fait que commencer. Les préoccupations concernant le plagiat, la propriété intellectuelle et l’éthique d’utilisation des œuvres littéraires sont plus pertinentes que jamais. Ainsi, il est essentiel de suivre l’évolution de ces technologies et d’engager une discussion éclairée sur leurs implications à long terme pour la société.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.




