Le grand mystère du génome non-codant
Alors que la science maîtrise bien le « langage » des codons formant les gènes protéiques, ceux-ci représentent à peine ~2 % du texte génomique ; le reste est rédigé dans une grammaire distincte que nous peinons encore à déchiffrer. À chaque séquençage d’un individu on observe environ 3,5 millions de variantes, dont seulement 0,6 % se situent dans les régions codantes — faciles à interpréter — tandis que la majorité tombe dans des régions régulatrices dont la fonction reste souvent obscure. Comprendre cette « zone grise » est essentiel pour relier variation génétique et phénotypes, maladies ou propriétés évolutives.
MPRAs : un microscope fonctionnel à très haut débit
Les massively parallel reporter assays (MPRAs) permettent d’évaluer, à grande échelle, comment des éléments régulateurs ou leurs variantes modulent l’expression d’un gène rapporteur. Le principe fondamental repose sur la mesure quantitative de l’ARN produit par chaque variante liée à un identifiant unique. Points clés :
- Reporter : gène témoin mesurable (ARN/protéine).
- Bibliothèque : milliers à des milliards de séquences testées simultanément.
- Codage : chaque variant est associé à une étiquette (barcode) pour quantifier son activité par séquençage.
Une première mise en œuvre systématique remonte à 2009 (Jay Shendure et al.) où l’on a testé chaque mutation d’un promoteur en liant chaque variante à un barcode et en mesurant ensuite l’abondance d’ARN correspondant.
Variantes techniques et défis pratiques
Différentes modalités existent : livraison épisomale (plasmides non intégrés) ou via lenticoronavirus (intégration aléatoire). Chaque approche a ses avantages (efficacité, types cellulaires accessibles) et inconvénients. Un défi majeur reste le barcode effect : les barcodes (~20 bases) peuvent perturber plus que la mutation testée (souvent 1–2 nt), ce qui oblige à utiliser typiquement 10–100 barcodes par séquence et à surveiller la recombinaison qui brouille les associations. Pour atténuer ces problèmes, des variantes méthodologiques comme STARR‑seq exploitent le fragment lui‑même comme « barcode », réduisant coût et complexité tout en détectant des enhancers actifs en contexte « DNA nu ».
Cartographier le régulome à l’échelle du génome
Les MPRAs ont atteint des tailles impressionnantes — des études ont porté sur des bibliothèques allant jusqu’à ~2 milliards de fragments — et permettent de repérer promoteurs, enhancers et leur compatibilité. Exemples concrets : la combinaison systématique de promoteurs et enhancers a été testée dans trois lignées humaines (travaux coordonnés par Ahituv et Shendure), et des équipes comme celle de van Steensel ont étudié la « compatibilité » graduée entre éléments régulateurs. Deux approches coexistent pour constituer les bibliothèques :
- fragmentation chromosomique pour explorer le paysage naturel ;
- ADN synthétique pour tester la grammaire (espacement, ordre, orientation et nombre de sites de liaison pour facteurs de transcription).
Ces études montrent que de nombreux éléments dits « inactifs » en chromatine compacte peuvent pourtant fonctionner quand on les teste en isolation.
Limites, validations et innovations méthodologiques
Les MPRAs restent une vue réductionniste : la plupart des fragments testés font moins de 1 000 bases, loin de la taille potentielle des régions régulatrices naturelles, et le contexte chromatinien n’est pas toujours fidèlement reproduit. Par conséquent, on distingue ce qu’une séquence peut faire de ce qu’elle fait réellement dans le génome. Pour valider les découvertes on recourt à des stratégies complémentaires : éditage CRISPR, modèles transgéniques, ou méthodes hybrides. Innovations récentes : la méthode Capture‑C qui identifie d’abord éléments physiquement interagissants puis les teste en MPRA — approche qui a par exemple permis d’isoler > 1 000 silencers difficilement caractérisables auparavant.
Applications concrètes et horizons : maladies, thérapies et IA
Les résultats des MPRAs sont déjà exploitables pour interpréter des mutations non codantes associées à des maladies, guider le design de thérapies géniques plus sûres et entraîner des systèmes d’IA capables de concevoir des circuits génétiques. Cas d’usage précis :
- Diagnostic : mieux classifier des variants non codants trouvés en séquençage clinique.
- Thérapeutique : concevoir des éléments régulateurs qui activent une thérapie uniquement dans un tissu ou sous un signal donné, réduisant les effets hors cible.
- Recherche du développement : études temporelles (ex. Anat Kreimer et collègues) ont mesuré l’activité d’enhancers pendant la différenciation neuronale pour reconstruire une « feuille de route » régulatrice du développement cérébral.
- Intelligence artificielle : ensembles de données MPRA alimentent des modèles capables de prédire et générer séquences régulatrices optimisées.
Ces pistes illustrent comment comprendre la « grammaire » régulatrice ouvre des possibilités pratiques en santé et biotechnologie, tout en nécessitant une validation rigoureuse et une réflexion éthique avant application clinique.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.



