1. L’enthousiasme contagieux et l’anecdote révélatrice
Un proche m’a récemment raconté, tout excité, une « découverte » : en donnant un seul mot à un LLM comme ChatGPT, on verrait immédiatement qu’il « comprend » et même qu’on pourrait inventer un mot pour tester cette compréhension. Exemple précis : entrer « glimmerflap » et observer si le modèle construit une définition cohérente — ce qu’il fait souvent, au point que certains comparent ces outils à l’invention de l’écriture. Points clés :
- Perception : la fluidité des réponses crée l’illusion d’une compréhension humaine.
- Expérience : les démonstrations informelles impressionnent, mais ne prouvent pas la nature réelle du modèle.
2. Ce que les modèles révèlent vraiment sur la structure du langage
Les LLMs montrent que le langage contient des régularités statistiques riches : collocations, syntaxes, cooccurrences sémantiques. Exemple précis : en entraînant un modèle sur des corpus massifs, il prédit le mot suivant avec des probabilités basées sur ces régularités (p.ex. « chien » souvent suivi de « aboyer »). Points clés :
- Statistiques : les modèles exploitent des patterns, pas une compréhension conceptuelle intrinsèque.
- Représentations : les vecteurs d’embeddings condensent les similarités sémantiques observées dans le corpus.
3. Limites concrètes : hallucinations, manque de terrain et fragilité
Malgré leurs performances, les modèles commettent des erreurs systématiques : invention de faits, contradictions, incapacité à interagir avec le monde physique. Exemple précis : demander une date historique erronée et recevoir une réponse plausiblement formulée mais fausse ; demander l’état actuel d’un appareil domestique et obtenir une supposition sans accès aux capteurs. Points clés :
- Hallucinations : générations factuellement incorrectes mais convaincantes.
- Dépendance aux données : erreurs liées aux lacunes ou aux biais du corpus d’entraînement.
4. Pourquoi l’analogie avec l’écriture est incomplète
Comparer LLMs et écriture occulte des différences fondamentales : l’écriture externalise la mémoire humaine et institue la traçabilité sociale, tandis que les modèles sont des systèmes statistiques entraînés sur ces traces. Exemple précis : l’écriture a permis la transmission intergénérationnelle de lois et de savoirs vérifiables ; un LLM peut synthétiser ce savoir mais n’établit pas de preuve historique. Points clés :
- Archivage : l’écriture crée des documents persistants, les modèles produisent des sorties éphémères.
- Responsabilité : l’institutionnalisation du savoir via l’écriture diffère du rôle algorithmique des LLMs.
5. Risques à long terme et enjeux sociétaux
Les usages massifs des modèles peuvent amplifier désinformation, concentrer le pouvoir et transformer le marché du travail. Exemple précis : automatisation de rédaction de faux articles ou d’appels marketing ciblés, entraînant une multiplication de contenus trompeurs ; substitution partielle de tâches analytiques par des outils mal supervisés. Points clés :
- Désinformation : génération à grande échelle de contenus plausibles mais faux.
- Concentration : contrôle des modèles par quelques entreprises et gouvernements.
- Biais : reproduction et amplification de stéréotypes présents dans les données.
6. Que faire : mesures pratiques et pistes d’action
Transformer l’émerveillement en responsabilité passe par des pratiques concrètes : évaluations rigoureuses, systèmes hybrides et régulation adaptée. Exemple précis : intégrer des modules de recherche factuelle (retrieval-augmented generation), audits publics des jeux de données, et formation à la littératie critique pour les utilisateurs. Recommandations clés :
- Transparence : publier méthodes d’entraînement et jeux de données quand c’est possible.
- Validation : associer vérification humaine et pipelines de fact-checking pour les usages sensibles.
- Gouvernance : créer standards et régulations proportionnés aux risques (audit, traçabilité des sorties).
- Recherche interdisciplinaire : combiner linguistique, éthique, droit et ingénierie pour évaluer impacts.







