Informations

Tout l'ADN est-il utilisé par les gènes (ADN codant) ?

Tout l'ADN est-il utilisé par les gènes (ADN codant) ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mon intuition me dit non, puisque seulement 1,5 à 2% sont constitués d'exons, donc cette affirmation serait fausse. L'énoncé correct devrait être : seulement environ 1,5 à 2 % de l'ADN total est utilisé par les gènes (ADN codant).

Ai-je raison dans cette hypothèse?


Le consortium ENCODE classe les éléments du génome humain et murin pour tenter de répondre à cette question.

Les travaux d'ENCODE suggèrent que jusqu'à 80% du génome est fonctionnel d'une manière ou d'une autre. En d'autres termes, d'après cette mesure de la limite supérieure, le rôle de l'ADN en biologie ne se limite apparemment pas au simple codage des gènes - il se passe beaucoup de choses sous le capot.

Cas pour les éléments génomiques fonctionnels abondants.

Des études biochimiques à l'échelle du génome, y compris des rapports récents d'ENCODE, ont révélé une activité omniprésente sur une fraction étonnamment grande du génome, y compris des régions non codantes et non conservées et des éléments répétés (58⇓-60). De tels résultats augmentent considérablement les estimations de la limite supérieure des séquences fonctionnelles candidates (Fig. 2 et Fig. S2). On a récemment découvert que de nombreuses régions génomiques humaines supposées non fonctionnelles regorgent d'activités biochimiques, y compris des portions d'éléments répétés, qui peuvent être liés par des facteurs de transcription et transcrits (79, 80), et on pense qu'ils sont parfois transformés en de nouveaux régions régulatrices (81⇓⇓-84). En dehors des 1,5% du génome couvert par la séquence codant pour les protéines, 11% du génome est associé à des motifs dans des régions liées à des facteurs de transcription ou à des empreintes de DNase haute résolution dans un ou plusieurs types cellulaires (Fig. 2), indiquant une contact par des protéines régulatrices. Les cartes d'occupation des facteurs de transcription et d'hypersensibilité à la DNase à résolution des nucléosomes se chevauchent grandement et couvrent chacune environ 15 % du génome. Dans l'ensemble, les modifications des histones associées aux promoteurs ou aux amplificateurs marquent ∼20% du génome, alors qu'un tiers du génome est marqué par des modifications associées à l'élongation transcriptionnelle. Plus de la moitié du génome a au moins une marque d'histone répressive. En accord avec les découvertes antérieures de la transcription omniprésente (85, 86), les cartes ENCODE des ARN polyadénylés et totaux couvrent au total plus de 75 % du génome. [emph. ajoutée]

Cependant, des personnes extérieures au consortium ENCODE ont critiqué cette recherche avec un langage très fort, comme dans cet article du célèbre critique Dan Graur :

En fait, les auteurs d'ENCODE auraient pu choisir n'importe lequel d'un certain nombre de pourcentages arbitraires comme « fonctionnels », et… ils l'ont fait ! Dans ses publications scientifiques, ENCODE a promu l'idée que 80 % du génome humain était fonctionnel. Les commentateurs scientifiques ont suivi et ont proclamé qu'au moins 80 % du génome est « actif et nécessaire » (Kolata 2012). Par la suite, l'un des principaux auteurs d'ENCODE a admis que la conférence de presse avait induit les gens en erreur en affirmant que 80 % de notre génome était « essentiel et utile ». Il a mis ce nombre à 40 % (Gregory 2012), bien qu'un autre auteur principal ait réduit la fraction du génome consacrée à la fonction à seulement 20 % (Hall 2012). Il est intéressant de noter que même lorsqu'un auteur principal d'ENCODE a réduit la fraction génomique fonctionnelle à 20 %, il a continué à insister sur le fait que le terme « ADN indésirable » doit « être totalement supprimé du lexique », inventant une nouvelle arithmétique selon laquelle 20 % > 80%. Dans son synopsis de l'année 2012, la revue Nature a adopté l'estimation la plus modeste, et a résumé les conclusions d'ENCODE en déclarant qu'« au moins 20 % du génome peut influencer l'expression des gènes » (Van Noorden 2012). La science s'en est tenue à ses armes maximalistes, et son résumé de 2012 a répété l'affirmation selon laquelle la « portion fonctionnelle » du génome humain est égale à 80 % (Anonyme 2012). Malheureusement, ni 80% ni 20% ne sont basés sur des preuves réelles.

D'autres critiques, dont Sean Eddy, se concentrent beaucoup sur ce qu'on appelle le paradoxe de la valeur C : étant donné un génome d'une certaine taille, s'il était entièrement fonctionnel - ou en grande partie fonctionnel, comme l'a prétendu le consortium ENCODE - alors tout serait sous pression évolutive, c'est à dire., vous vous attendriez à ce que certains taux de mutation se produisent, mais ce n'est pas le cas. La biologie évolutive dirait qu'environ 5 à 10% sont fonctionnels, je crois, en fonction de l'ampleur de la sélection et du lieu. Ainsi, ces critiques diraient (et ont effectivement dit) beaucoup de choses négatives sur les résultats rapportés par ENCODE.

Je soupçonne que la vraie réponse, s'il y en a une, dépend de ce que l'on définit comme fonctionnel et évolutif conservé, par quels moyens on le mesure, et quel est l'équilibre entre fonctionnalité et conservation. Vous choisissez vos définitions et vos processus, et vous acceptez les compromis et les limitations qui accompagnent ces choix.

Avertissement : je contribue aux articles d'ENCODE publiés en La nature en 2012.


Une étude révolutionnaire renverse la théorie de l'ADN indésirable dans le génome

De longues étendues d'ADN auparavant qualifiées de "poubelles" sont en fait cruciales pour le fonctionnement de notre génome, a déclaré mercredi une équipe internationale de chercheurs.

Il s'agit du changement le plus important dans la compréhension des scientifiques du fonctionnement de notre ADN depuis le séquençage du génome humain en 2000, lorsqu'il a été découvert que notre corps est construit et contrôlé par beaucoup moins de gènes que prévu. Maintenant, la prochaine génération de généticiens a mis à jour cette image.

Les résultats du projet international Encode auront un impact énorme pour les généticiens qui tentent de comprendre comment les gènes fonctionnent. Les résultats fourniront également de nouvelles pistes aux scientifiques à la recherche de traitements pour des maladies telles que les maladies cardiaques, le diabète et la maladie de Crohn qui ont leurs racines en partie dans des problèmes d'ADN. Jusqu'à présent, l'accent avait été largement mis sur la recherche d'erreurs dans les gènes eux-mêmes, mais la recherche Encode aidera à guider la chasse aux problèmes qui se trouvent ailleurs dans notre séquence d'ADN.

Le Dr Ewan Birney, de l'Institut européen de bioinformatique près de Cambridge, l'un des principaux chercheurs du projet Encode, a déclaré : « En 2000, nous avons publié le projet de génome humain et, en 2003, nous avons publié le génome humain fini et nous avons toujours su que allait être un point de départ. Nous avons toujours su que les gènes codant pour les protéines n'étaient pas toute l'histoire. "

Pendant des années, les vastes étendues d'ADN entre nos quelque 20 000 gènes codant pour les protéines - plus de 98 % de la séquence génétique à l'intérieur de chacune de nos cellules - ont été considérées comme de l'ADN « poubelle ». Déjà tombé en disgrâce ces dernières années, ce concept sera désormais, avec les travaux d'Encode, relégué aux livres d'histoire.

Encode est la plus grande mise à jour des données du génome humain depuis la publication de sa version finale en 2003 et la première tentative systématique de déterminer ce que fait l'ADN en dehors des gènes codant pour les protéines. Les chercheurs ont découvert que c'est loin d'être inutile : dans ces régions, ils ont identifié plus de 10 000 nouveaux « gènes » qui codent pour des composants qui contrôlent le fonctionnement des gènes codant pour les protéines plus familiers. Jusqu'à 18% de notre séquence d'ADN est impliquée dans la régulation des moins de 2% de l'ADN qui code pour les protéines. Au total, selon les scientifiques d'Encode, environ 80% de la séquence d'ADN peut se voir attribuer une sorte de fonction biochimique.

Les scientifiques savent que si la plupart des cellules de notre corps contiennent l'intégralité de notre code génétique, tous les gènes codant pour les protéines ne sont pas actifs. Une cellule hépatique contient des enzymes utilisées pour métaboliser l'alcool et d'autres toxines, tandis que les cellules ciliées fabriquent la protéine kératine. Grâce à un mécanisme qui régule ses gènes, la cellule ciliée sait qu'elle doit fabriquer de la kératine plutôt que des enzymes hépatiques, et la cellule hépatique sait qu'elle doit fabriquer les enzymes hépatiques et non les protéines capillaires.

"Ce contrôle doit avoir été quelque part dans le génome, et nous avons toujours su que - pour certains gènes individuels - c'était un élément parfois assez éloigné du gène", a déclaré Birney. "Mais nous n'avions pas une vue à l'échelle du génome à ce sujet. Nous avons donc commencé à travailler sur la façon dont nous pourrions découvrir ces éléments."

Les résultats du projet Encode de cinq ans sont publiés mercredi dans 30 articles dans les revues Nature, Science, Genome Biology et Genome Research. Les chercheurs ont cartographié des commutateurs de 4 m dans ce qui était autrefois considéré comme de l'ADN indésirable, dont beaucoup les aideront à mieux comprendre une gamme de maladies humaines courantes, du diabète aux maladies cardiaques, qui dépendent de l'interaction complexe de centaines de gènes et de leurs éléments réglementaires.

"Les éléments réglementaires sont les choses qui activent et désactivent les gènes", explique le professeur Mike Snyder de l'Université de Stanford, qui était un chercheur principal du consortium Encode. "Une grande partie de la différence entre les gens est due aux différences d'efficacité de ces éléments régulateurs. Il y a plus de variantes, pensons-nous, dans les éléments régulateurs que dans les gènes eux-mêmes."

Les gènes ne peuvent pas fonctionner sans ces éléments régulateurs. Si la régulation va mal, des gènes défectueux peuvent provoquer des maladies comme le cancer, l'athérosclérose, le diabète de type 2, le psoriasis et la maladie de Crohn. Des erreurs dans la régulation d'un gène connu sous le nom de Sonic Hedgehog, par exemple, seraient à l'origine de certains cas de polydactylie humaine dans lesquels les individus ont des orteils ou des doigts supplémentaires.

Le professeur Anne Ferguson-Smith, de l'Université de Cambridge, a déclaré: "Ils ont également des implications importantes pour la croissance et le développement des embryons et des fœtus pendant la grossesse. Ce sont les types d'éléments qui permettent à vos tissus et organes de se développer correctement, au bon moment et place, et contenant les bons types de cellules."

Les scientifiques d'Encode ont découvert que 9 % de l'ADN humain est impliqué dans le codage des commutateurs réglementaires, bien que Birney pense que le chiffre réel pourrait s'avérer être d'environ 20 %. "L'une des grandes surprises est que nous voyons beaucoup plus d'éléments [réglementaires] que ce à quoi je m'attendais", a-t-il déclaré.

Le projet a identifié environ 10 000 segments d'ADN, que les scientifiques d'Encode ont appelés gènes non codants, qui ne fabriquent pas de protéines mais, à la place, un type d'ARN - l'équivalent simple brin de l'ADN. Il existe de nombreux types de molécules d'ARN dans les cellules, chacune avec un rôle spécifique tel que le transport de messages ou la transcription du code ADN dans la première étape de fabrication d'une protéine. Cependant, les 10 000 gènes non codants portent des instructions pour construire les grandes et petites molécules d'ARN nécessaires pour réguler les actions des 20 000 gènes codant pour les protéines.

Les résultats ont déjà mis en lumière des études massives antérieures sur les données génétiques. Ces dernières années, les scientifiques ont comparé le code génétique de milliers de personnes atteintes d'une maladie spécifique (comme le diabète, les troubles bipolaires, la maladie de Crohn ou les maladies cardiaques) avec le code ADN de milliers de personnes en bonne santé, dans le but de localiser des mutations qui pourraient représentent une partie du risque de développer cette maladie. Ces soi-disant études d'association pangénomique (GWAS) ont identifié des dizaines d'emplacements dans l'ADN qui semblent augmenter le risque d'une personne de développer une maladie - mais la grande majorité sont loin d'être des gènes codant pour des protéines. Cela a du sens si des régions auparavant considérées comme "poubelles" sont en fait vitales pour contrôler l'expression des gènes codant pour les protéines.

En effet, il y a un grand chevauchement entre les emplacements identifiés par GWAS et les commutateurs de régulation identifiés dans Encode. "Quand j'ai vu ce résultat pour la première fois, j'ai pensé que c'était trop beau pour être vrai. Nous avons fait l'analyse de cinq manières différentes maintenant et cela tient toujours", dit Birney.

Comprendre certains de ces éléments réglementaires pourrait aider à expliquer certains des déclencheurs environnementaux de différentes maladies.

La maladie de Crohn, par exemple, est une maladie à long terme qui provoque une inflammation de la muqueuse du système digestif et affecte jusqu'à 60 000 personnes au Royaume-Uni, mais les scientifiques ne peuvent pas expliquer pleinement pourquoi certaines personnes en souffrent et d'autres pas, même lorsque ils ont tous les mutations génétiques associées à un risque élevé. Une hypothèse est que la maladie pourrait être déclenchée par une infection bactérienne. "Peut-être qu'il y a un endroit au milieu de nulle part [dans l'ADN], pas près d'un gène codant pour une protéine, que si vous avez une variante, vous êtes plus sensible à cette bactérie, si vous avez une autre variante, vous êtes moins sensible ", dit Birney. "Donc, vous contractez probablement la maladie de Crohn parce que vous avez le type le plus sensible et que cette infection bactérienne particulière s'est produite à un moment où vous étiez vulnérable."

Les 442 chercheurs du consortium Encode, répartis dans 32 instituts à travers le monde, ont utilisé 300 ans de temps informatique et cinq ans en laboratoire pour obtenir leurs résultats. Ils ont examiné un total de 147 types de tissus - y compris des cellules cancéreuses, des extraits de foie, des cellules endothéliales de cordon ombilical et des cellules souches dérivées d'embryons - et les ont soumis à une centaine d'expériences différentes, enregistrant quelles parties du code ADN ont été activées dans quelles cellules à quels moments.

Les phases actuelles et futures d'Encode s'avéreront utiles non seulement pour les scientifiques, mais aussi pour ceux qui souhaitent une approche plus personnalisée de la médecine dans les décennies à venir. "Nous sommes à une époque où les gens commencent à séquencer leurs génomes. Avec les données Encode, nous pourrions commencer à cartographier les informations réglementaires", explique Snyder.

Cela signifie que les différences individuelles dans les maladies des personnes peuvent être ciblées plus efficacement pour le traitement. "Les maladies ont été définies par la profession médicale observant les symptômes", explique le Dr Tim Hubbard du Wellcome Trust Sanger Institute de Cambridge. "[But] nous savons, par exemple, que le cancer du sein n'est pas une maladie, mais qu'il existe plusieurs types de cancer du sein avec toutes sortes de processus mécaniques différents qui vont mal.

"Un médicament donné ne fonctionne que chez environ un tiers des personnes à qui vous le donnez, mais vous ne savez pas à quel tiers. Cela est en grande partie lié à la génomique, donc si vous connaissiez la relation entre le génome d'une personne et quels médicaments fonctionnent pour eux et lesquels ils ne devraient pas prendre car cela leur donne des effets secondaires, cela améliorerait la médecine. »

Comprendre exactement comment fonctionne chaque type de cellule dans le corps - en d'autres termes quels gènes sont activés ou désactivés à différents stades de sa fonction - sera également utile dans les futures thérapies par cellules souches. Si les médecins veulent cultiver du tissu hépatique de remplacement, par exemple, ils pourront vérifier qu'il est sans danger en comparant les fonctions ADN de leurs cellules fabriquées avec les données de cellules hépatiques normales.

Birney dit que la décennie écoulée depuis la publication de la première ébauche du génome humain a montré que la génétique est beaucoup plus complexe que quiconque aurait pu le prédire. "Nous pensions que la vie était peut-être plus facile auparavant et plus confortable parce que nous étions simplement plus ignorants. La chose la plus importante qui se passe, c'est que nous perdons une partie de notre ignorance et, en effet, c'est très compliqué", dit-il. "Vous devez vous rappeler que ces génomes font nous-mêmes l'une des choses les plus compliquées que nous connaissions. L'idée que le livre de recettes serait facile à comprendre est une sorte d'orgueil. Je pense toujours que nous sommes au début de ce voyage , nous sommes encore en phase d'échauffement, les premiers kilomètres de ce marathon."


Nanomédecine tout ADN génétiquement codée et produite biologiquement basée sur un assemblage en un seul pot de dendrimères d'ADN pour une régulation génique ciblée

Les nanomédicaments tout ADN ont émergé comme des médicaments anti-tumoraux potentiels. La nanotechnologie de l'ADN offre aux nanomédicaments entièrement ADN des possibilités illimitées de contrôle de la diversification de la taille, de la forme et des charges des motifs thérapeutiques. L'ADN étant un polymère biologique, il est possible de coder génétiquement et de produire les nanomédicaments entièrement ADN dans des bactéries vivantes. Ici, les nanomédicaments à base de dendrimères d'ADN sont conçus pour s'adapter à la production biologique, qui est construite par les blocs de construction flexibles à 3 bras pour permettre un assemblage d'ADN en un seul pot très efficace. Pour la première fois, un nanomédicament à base d'ADN, le D4-3-As-DzSur, est codé génétiquement avec succès, produit biotechnologiquement et directement auto-assemblé. La performance du D4-3-As-DzSur produit biologiquement dans la régulation génique ciblée a été confirmée par des études in vitro et in vivo. La capacité de production biologique permettra la production à faible coût et à grande échelle de nanomédicaments entièrement à ADN et favorisera les applications cliniques.

En tant que service à nos auteurs et lecteurs, cette revue fournit des informations complémentaires fournies par les auteurs. Ces documents sont examinés par des pairs et peuvent être réorganisés pour une livraison en ligne, mais ne sont ni retouchés ni composés. Les problèmes de support technique résultant des informations de support (autres que les fichiers manquants) doivent être adressés aux auteurs.

Nom de fichier La description
anie202012916-sup-0001-misc_information.pdf2,3 Mo Supplémentaire

Remarque : L'éditeur n'est pas responsable du contenu ou de la fonctionnalité des informations fournies par les auteurs. Toute question (autre que le contenu manquant) doit être adressée à l'auteur correspondant à l'article.


Contenu

Les vaccins à ADN sont des « vaccins de troisième génération ». "Depuis plus de cent ans, la vaccination a été affectée par l'une des deux approches suivantes : soit l'introduction d'antigènes spécifiques contre lesquels le système immunitaire réagit directement, soit l'introduction d'agents infectieux vivants atténués qui se répliquent dans l'hôte sans provoquer de maladie [et qui peuvent] synthétiser les antigènes qui amorcent ensuite le système immunitaire. [3] "Récemment, une approche radicalement nouvelle de la vaccination a été développée." [3]

Les vaccins à ADN contiennent de l'ADN qui code pour des protéines spécifiques (antigènes) d'un agent pathogène. L'ADN est injecté dans le corps et absorbé par les cellules, dont les processus métaboliques normaux synthétisent des protéines sur la base du code génétique du plasmide qu'elles ont absorbé. Parce que ces protéines contiennent des régions de séquences d'acides aminés caractéristiques des bactéries ou des virus, elles sont reconnues comme étrangères et lorsqu'elles sont traitées par les cellules hôtes et affichées à leur surface, le système immunitaire est alerté, ce qui déclenche alors des réponses immunitaires. [6] [7] Alternativement, l'ADN peut être encapsulé dans une protéine pour faciliter l'entrée dans les cellules. Si cette protéine de capside est incluse dans l'ADN, le vaccin résultant peut combiner la puissance d'un vaccin vivant sans risques de réversion.

En 1983, Enzo Paoletti et Dennis Panicali du ministère de la Santé de New York ont ​​conçu une stratégie pour produire des vaccins à ADN recombinant en utilisant le génie génétique pour transformer le vaccin antivariolique ordinaire en vaccins capables de prévenir d'autres maladies.[8] Ils ont modifié l'ADN du virus cowpox en insérant un gène d'autres virus (à savoir le virus Herpes simplex, l'hépatite B et la grippe). [9] [10] En 1993, Jeffrey Ulmer et ses collègues des Laboratoires de recherche Merck ont ​​démontré que l'injection directe de souris avec un ADN plasmidique codant pour un antigène de la grippe protégeait les animaux contre une infection expérimentale ultérieure par le virus de la grippe. [11] En 2016, un vaccin à ADN contre le virus Zika a commencé à être testé chez l'homme aux National Institutes of Health. L'étude devait impliquer jusqu'à 120 sujets âgés de 18 à 35 ans. Séparément, Inovio Pharmaceuticals et GeneOne Life Science ont commencé à tester un vaccin à ADN différent contre Zika à Miami. Le vaccin NIH est injecté dans la partie supérieure du bras sous haute pression. La fabrication des vaccins en volume n'était toujours pas résolue en août 2016. [4] Des essais cliniques de vaccins à ADN pour prévenir le VIH sont en cours. [12]

Aucun vaccin à ADN n'a été approuvé pour un usage humain aux États-Unis. Peu d'essais expérimentaux ont évoqué une réponse suffisamment forte pour protéger contre la maladie et l'utilité de la technique reste à prouver chez l'homme. Un vaccin vétérinaire à ADN pour protéger les chevaux contre le virus du Nil occidental a été approuvé.[12][13] L'immunisation par ADN est également à l'étude comme moyen de développer des sérums antivenimeux.[14] La vaccination par ADN peut être utilisée comme plate-forme technologique pour l'induction d'anticorps monoclonaux.[15]

  • Aucun risque d'infection [7]
  • Présentation de l'antigène par les molécules du CMH de classe I et de classe II [7]
  • Polariser la réponse des lymphocytes T vers le type 1 ou le type 2 [7]
  • Réponse immunitaire centrée sur l'antigène d'intérêt
  • Facilité de développement et de production [7]
  • Stabilité pour le stockage et l'expédition
  • Rentabilité
  • Évite le besoin de synthèse peptidique, d'expression et de purification de protéines recombinantes et d'utilisation d'adjuvants toxiques [13]
  • Persistance à long terme de l'immunogène [6]
  • In vivo l'expression garantit que la protéine ressemble plus à la structure eucaryote normale, avec des modifications post-traductionnelles qui l'accompagnent [6]
  • Limité aux immunogènes protéiques (pas utile pour les antigènes non protéiques tels que les polysaccharides bactériens)
  • Potentiel de transformation atypique des protéines bactériennes et parasitaires [7]
  • Potentiel lors de l'utilisation de l'administration par pulvérisation nasale de nanoparticules d'ADN plasmidique pour transfecter des cellules non cibles, telles que des cellules cérébrales [14]
  • Contamination croisée lors de la fabrication de différents types de vaccins vivants dans la même installation

Conception de vecteur

Les vaccins à ADN provoquent la meilleure réponse immunitaire lorsque des vecteurs d'expression hautement actifs sont utilisés. Ce sont des plasmides qui consistent généralement en un puissant promoteur viral pour conduire la transcription et la traduction in vivo du gène (ou de l'ADN complémentaire) d'intérêt. [15] L'intron A peut parfois être inclus pour améliorer la stabilité de l'ARNm et donc augmenter l'expression des protéines. [16] Les plasmides comprennent également un fort signal de polyadénylation/terminaison transcriptionnelle, comme l'hormone de croissance bovine ou les séquences de polyadénylation de bêta-globuline de lapin. [6] [7] [17] Les vecteurs polycistroniques (ceux situés sur plusieurs sites génomiques) sont parfois construits pour exprimer plus d'un immunogène, ou pour exprimer un immunogène et une protéine immunostimulante. [18]

Étant donné que le plasmide est le « véhicule » à partir duquel l'immunogène est exprimé, l'optimisation de la conception du vecteur pour une expression maximale de la protéine est essentielle. [18] Une façon d'améliorer l'expression des protéines consiste à optimiser l'utilisation des codons d'ARNm pathogènes pour les cellules eucaryotes. Les agents pathogènes ont souvent des teneurs en AT différentes de celles de l'espèce cible, de sorte que la modification de la séquence génétique de l'immunogène pour refléter les codons plus couramment utilisés dans l'espèce cible peut améliorer son expression. [19]

Une autre considération est le choix du promoteur. Le promoteur SV40 était utilisé de manière conventionnelle jusqu'à ce que la recherche montre que les vecteurs entraînés par le promoteur du virus du sarcome de Rous (RSV) avaient des taux d'expression beaucoup plus élevés. [6] Plus récemment, l'expression et l'immunogénicité ont été encore augmentées dans les systèmes modèles par l'utilisation du promoteur précoce immédiat du cytomégalovirus (CMV) et d'un élément transcriptionnel rétroviral agissant en cis. [20] Des modifications supplémentaires pour améliorer les taux d'expression comprennent l'insertion de séquences amplificatrices, d'introns synthétiques, de séquences de tête tripartite d'adénovirus (TPL) et de modifications des séquences de polyadénylation et de terminaison transcriptionnelle. [6] Un exemple de plasmide de vaccin à ADN est pVAC, qui utilise le promoteur SV40.

Les phénomènes d'instabilité structurelle sont particulièrement préoccupants pour la fabrication de plasmides, la vaccination par ADN et la thérapie génique. [21] Les régions accessoires appartenant au squelette plasmidique peuvent s'engager dans un large éventail de phénomènes d'instabilité structurelle. Les catalyseurs bien connus d'instabilité génétique comprennent les répétitions directes, inversées et en tandem, qui sont visibles dans de nombreux vecteurs de clonage et d'expression disponibles dans le commerce. Par conséquent, la réduction ou l'élimination complète des séquences de squelette non codantes étrangères réduirait de manière significative la propension à de tels événements à se produire et, par conséquent, le potentiel recombinogène global du plasmide. [22]

Mécanisme des plasmides

Une fois que le plasmide s'insère dans le noyau cellulaire transfecté, il code pour une chaîne peptidique d'un antigène étranger. À sa surface, la cellule présente l'antigène étranger avec à la fois des molécules du complexe d'histocompatibilité (CMH) de classe I et de classe II. La cellule présentatrice de l'antigène se déplace ensuite vers les ganglions lymphatiques et présente le peptide antigénique et la molécule de costimulation signalée par la cellule T, initiant la réponse immunitaire. [23]

Conception d'insert de vaccin

Les immunogènes peuvent être ciblés sur divers compartiments cellulaires pour améliorer les réponses des anticorps ou des lymphocytes T cytotoxiques. Les antigènes sécrétés ou liés à la membrane plasmique sont plus efficaces pour induire des réponses en anticorps que les antigènes cytosoliques, tandis que les réponses des lymphocytes T cytotoxiques peuvent être améliorées en ciblant les antigènes pour la dégradation cytoplasmique et l'entrée ultérieure dans la voie du complexe majeur d'histocompatibilité (CMH) de classe I. [7] Ceci est généralement accompli par l'ajout de signaux d'ubiquitine N-terminaux. [24] [25] [26]

La conformation de la protéine peut également affecter les réponses des anticorps. Les structures « ordonnées » (telles que les particules virales) sont plus efficaces que les structures non ordonnées. [27] Des chaînes de minigènes (ou épitopes du CMH de classe I) de différents agents pathogènes augmentent les réponses cytotoxiques des cellules T à certains agents pathogènes, en particulier si un épitope TH est également inclus. [7]

Les vaccins à ADN ont été introduits dans les tissus animaux par de multiples méthodes. Les deux approches les plus populaires étaient en 1999 l'injection d'ADN dans une solution saline : en utilisant une aiguille hypodermique standard ou en utilisant un pistolet à gènes. [28] Plusieurs autres techniques ont été documentées dans les années intermédiaires.

Injection de solution saline

L'injection dans une solution saline est normalement effectuée par voie intramusculaire (IM) dans le muscle squelettique, ou par voie intradermique (ID), délivrant l'ADN aux espaces extracellulaires. Ceci peut être assisté soit 1) par électroporation [29] 2) en endommageant temporairement les fibres musculaires avec des myotoxines telles que la bupivacaïne ou 3) en utilisant des solutions hypertoniques de sérum physiologique ou de saccharose. [6] Les réponses immunitaires à cette méthode peuvent être affectées par des facteurs tels que le type d'aiguille, [13] l'alignement de l'aiguille, la vitesse d'injection, le volume d'injection, le type de muscle et l'âge, le sexe et l'état physiologique du receveur. [6]

Pistolet à gènes

L'administration par canon à gènes accélère de manière balistique l'ADN plasmidique (ADNp) qui a été absorbé par des microparticules d'or ou de tungstène dans les cellules cibles, en utilisant de l'hélium comprimé comme accélérateur. [6] [18]

Livraison de surface muqueuse

Les alternatives comprenaient l'instillation en aérosol d'ADN nu sur les surfaces muqueuses, telles que la muqueuse nasale et pulmonaire [18] et l'administration topique d'ADNp à l'œil [30] et à la muqueuse vaginale. [18] La livraison de surface muqueuse a également été réalisée en utilisant des préparations cationiques de liposomes-ADN, [7] des microsphères biodégradables, [31] [18] atténuées Salmonelle, [32] Shigella ou Listeria des vecteurs pour administration orale à la muqueuse intestinale [33] et des vecteurs adénoviraux recombinants. [18]

Véhicule polymère

Un véhicule hybride composé de cellules bactériennes et de polymères synthétiques a été utilisé pour l'administration de vaccins à ADN. Un E. coli le noyau interne et l'enveloppe externe poly(bêta-amino ester) fonctionnent en synergie pour augmenter l'efficacité en s'attaquant aux barrières associées à l'administration des gènes des cellules présentatrices d'antigène, notamment l'absorption et l'internalisation cellulaires, l'échappement phagosomal et la concentration de cargaison intracellulaire. Testé sur des souris, le vecteur hybride s'est avéré induire une réponse immunitaire. [34] [35]

Vaccination ELI

Une autre approche de la vaccination par ADN est l'immunisation par bibliothèque d'expression (ELI). En utilisant cette technique, potentiellement tous les gènes d'un agent pathogène peuvent être délivrés en même temps, ce qui peut être utile pour les agents pathogènes difficiles à atténuer ou à cultiver. [6] ELI peut être utilisé pour identifier quels gènes induisent une réponse protectrice. Cela a été testé avec Mycoplasme pulmonaire, un pathogène pulmonaire murin avec un génome relativement petit. Même les bibliothèques d'expression partielles peuvent induire une protection contre une provocation ultérieure. [36]

Comparaison tabulaire utile

  • Pas de mécanisme de livraison spécial
  • Expression permanente ou semi-permanente
  • L'ADNp se propage rapidement dans tout le corps
  • Site inefficace pour l'absorption en raison de la morphologie du tissu musculaire
  • Des quantités relativement importantes d'ADN utilisées
  • La réponse Th1 peut ne pas être la réponse requise
  • ADN bombardé directement dans les cellules
  • Petites quantités d'ADN
  • La réponse Th2 peut ne pas être la réponse requise
  • Nécessite des particules inertes comme support
  • Aucune particule requise
  • L'ADN peut être délivré aux cellules mm à cm sous la surface de la peau
  • Cisaillement important de l'ADN après expulsion à haute pression
  • Expression 10 fois plus faible et réponse immunitaire plus faible
  • Nécessite de grandes quantités d'ADN (jusqu'à 300 g)
  • Des niveaux élevés de réponse immunitaire peuvent être générés
  • Peut augmenter la transfection de l'ADNp administré par voie intraveineuse
  • Les complexes liposomes-ADN administrés par voie intraveineuse peuvent potentiellement transfecter tous les tissus
  • Les complexes liposomes-ADN administrés par voie intranasale peuvent entraîner l'expression dans la muqueuse distale ainsi que la muqueuse nasale et la génération d'anticorps IgA
  • Toxicité
  • Inefficacité dans le sérum
  • Risque de maladie ou de réactions immunitaires

La méthode d'administration détermine la dose requise pour augmenter une réponse immunitaire efficace. Les injections de solution saline nécessitent des quantités variables d'ADN, de 10 g à 1 mg, tandis que les livraisons de pistolets à gènes nécessitent 100 à 1000 fois moins. [37] En général, 0,2 g – 20 g sont nécessaires, bien que des quantités aussi faibles que 16 ng aient été rapportées. [6] Ces quantités varient selon les espèces. Les souris, par exemple, nécessitent environ 10 fois moins d'ADN que les primates. [7] Les injections de solution saline nécessitent plus d'ADN car l'ADN est délivré aux espaces extracellulaires du tissu cible (normalement le muscle), où il doit surmonter des barrières physiques (telles que la lame basale et de grandes quantités de tissu conjonctif) avant d'être prélevé. par les cellules, tandis que les livraisons de pistolets à gènes entraînent/forcent l'ADN directement dans les cellules, ce qui entraîne moins de « gaspillage ». [6] [7]

Réponses des lymphocytes T auxiliaires

La vaccination par ADN peut augmenter plusieurs TH réponses, y compris la lymphoprolifération et la génération d'une variété de profils de cytokines. Un avantage majeur des vaccins à ADN est la facilité avec laquelle ils peuvent être manipulés pour biaiser le type d'aide des lymphocytes T vers une réponse TH1 ou TH2. [38] Chaque type a des modèles distinctifs d'expression de lymphokine et de chimiokine, des types spécifiques d'immunoglobulines, des modèles de trafic de lymphocytes et des types de réponses immunitaires innées.

D'autres types d'aide des lymphocytes T

Le type d'aide des lymphocytes T généré est influencé par la méthode d'administration et le type d'immunogène exprimé, ainsi que par le ciblage des différents compartiments lymphoïdes. [6] [39] En règle générale, les injections d'aiguilles salines (IM ou ID) ont tendance à induire des réponses TH1, tandis que l'administration d'un pistolet à gènes augmente les réponses TH2. [38] [39] Cela est vrai pour les antigènes intracellulaires et liés à la membrane plasmique, mais pas pour les antigènes sécrétés, qui semblent générer des réponses TH2, quelle que soit la méthode de livraison. [40]

En général, le type d'aide des lymphocytes T généré est stable dans le temps et ne change pas lorsqu'il est provoqué ou après des immunisations ultérieures qui auraient normalement provoqué le type de réponse opposé dans un échantillon naïf. [38] [39] Cependant, Mor et al.. (1995) [15] souris immunisées et stimulées avec de l'ADNp codant pour la protéine circumsporozoïte du parasite du paludisme de la souris Plasmodium yoelii (PyCSP) et a constaté que la réponse TH2 initiale a changé, après le rappel, en une réponse TH1.

Base pour différents types d'aide des lymphocytes T

Le fonctionnement de ces différentes méthodes, les formes d'antigène exprimées et les différents profils d'aide des lymphocytes T ne sont pas compris. On pensait que les quantités relativement importantes d'ADN utilisées dans l'injection IM étaient responsables de l'induction des réponses TH1. Cependant, les preuves ne montrent aucune différence liée à la dose dans le type de TH. [38] Le type d'aide des lymphocytes T élevé est déterminé par l'état différencié des cellules présentatrices d'antigène. Les cellules dendritiques peuvent se différencier pour sécréter de l'IL-12 (qui prend en charge le développement des cellules TH1) ou de l'IL-4 (qui prend en charge les réponses TH2). [41] L'ADNp injecté par aiguille est endocytosé dans la cellule dendritique, qui est ensuite stimulée pour se différencier pour la production de cytokines TH1, [42] tandis que le canon à gènes bombarde l'ADN directement dans la cellule, contournant ainsi la stimulation TH1.

Utilisations pratiques de l'aide des cellules T polarisées

La polarisation dans l'aide des lymphocytes T est utile pour influencer les réponses allergiques et les maladies auto-immunes. Dans les maladies auto-immunes, l'objectif est de déplacer la réponse TH1 autodestructrice (avec son activité cellulaire T cytotoxique associée) vers une réponse TH2 non destructive. Ceci a été appliqué avec succès dans l'amorçage pré-maladie pour le type de réponse souhaité dans des modèles précliniques [7] et réussit quelque peu à modifier la réponse pour une maladie établie. [43]

Réponses des lymphocytes T cytotoxiques

L'un des avantages des vaccins à ADN est qu'ils sont capables d'induire des lymphocytes T cytotoxiques (CTL) sans le risque inhérent associé aux vaccins vivants. Les réponses CTL peuvent être élevées contre des épitopes CTL immunodominants et immunorécessifs, [44] ainsi que des épitopes CTL sous-dominants, [31] d'une manière qui semble imiter une infection naturelle. Cela peut s'avérer être un outil utile pour évaluer les épitopes CTL et leur rôle dans la fourniture de l'immunité.

Les cellules T cytotoxiques reconnaissent les petits peptides (8 à 10 acides aminés) complexés aux molécules du CMH de classe I. [45] Ces peptides sont dérivés de protéines cytosoliques endogènes qui sont dégradées et livrées à la molécule naissante du CMH de classe I dans le réticulum endoplasmique (RE). [45] Le ciblage des produits géniques directement vers le RE (par l'ajout d'une séquence d'insertion amino-terminale) devrait donc améliorer les réponses CTL. Cela a été démontré avec succès en utilisant des virus de la vaccine recombinants exprimant des protéines de la grippe [45], mais le principe devrait également être applicable aux vaccins à ADN. Le ciblage des antigènes pour la dégradation intracellulaire (et donc l'entrée dans la voie du CMH de classe I) par l'ajout de séquences signal d'ubiquitine, ou la mutation d'autres séquences signal, s'est avéré efficace pour augmenter les réponses CTL. [25]

Les réponses CTL peuvent être améliorées par co-inoculation avec des molécules co-stimulatrices telles que B7-1 ou B7-2 pour les vaccins à ADN contre la nucléoprotéine de la grippe, [44] [46] ou GM-CSF pour les vaccins à ADN contre le modèle murin du paludisme P. yoelii. [47] Il a été démontré que la co-inoculation avec des plasmides codant pour les molécules co-stimulatrices IL-12 et TCA3 augmente l'activité des CTL contre les antigènes nucléoprotéiques du VIH-1 et de la grippe. [46] [48]

Réponse humorale (anticorps)

Les réponses en anticorps induites par les vaccinations à l'ADN sont influencées par de multiples variables, y compris le type d'antigène, le nombre d'antigènes (c'est-à-dire intracellulaire vs sécrété), la fréquence et le site de la dose d'immunisation et la méthode d'administration de l'antigène.

Cinétique de la réponse des anticorps

Les réponses humorales après une seule injection d'ADN peuvent être beaucoup plus durables qu'après une seule injection avec une protéine recombinante. Les réponses en anticorps contre la protéine d'enveloppe du virus de l'hépatite B (VHB) (AgHBs) ont été maintenues jusqu'à 74 semaines sans rappel, tandis que le maintien à vie de la réponse protectrice à l'hémagglutinine de la grippe a été démontré chez la souris après l'administration d'un pistolet à gènes. [49] Les cellules sécrétant des anticorps migrent vers la moelle osseuse et la rate pour la production d'anticorps à long terme et s'y localisent généralement après un an. [49]

Les comparaisons des réponses en anticorps générées par l'infection naturelle (virale), l'immunisation avec une protéine recombinante et l'immunisation avec l'ADNp sont résumées dans le tableau 4. Les réponses en anticorps générées par l'ADN augmentent beaucoup plus lentement que lorsqu'une infection naturelle ou une immunisation par protéine recombinante se produit. Jusqu'à 12 semaines peuvent être nécessaires pour atteindre des titres de pointe chez les souris, bien qu'un rappel puisse réduire l'intervalle. Cette réponse est probablement due aux faibles niveaux d'antigène exprimés sur plusieurs semaines, qui soutiennent à la fois les phases primaire et secondaire de la réponse en anticorps. Un vaccin à ADN exprimant la protéine de petite et moyenne enveloppe du VHB a été injecté à des adultes atteints d'hépatite chronique. Le vaccin a entraîné la production de cellules spécifiques d'interféron gamma. Des cellules T spécifiques pour les antigènes des protéines de l'enveloppe moyenne ont également été développées. La réponse immunitaire des patients n'était pas assez robuste pour contrôler l'infection par le VHB [50]

Tableau 4. Comparaison des réponses en anticorps T-dépendantes augmentées par les immunisations par ADN, les inoculations de protéines et les infections virales
Méthode d'immunisation
Vaccin ADN Protéine recombinante Infection naturelle
Quantité d'antigène inducteur ng g ? (ng-μg)
Durée de présentation de l'antigène plusieurs semaines < 1 semaine plusieurs semaines
Cinétique de la réponse des anticorps montée lente montée rapide montée rapide
Nombre d'inoculations pour obtenir des IgG d'avidité élevée et migration de l'ASC vers la moelle osseuse une deux une
Isotype Ab (modèles murins) C'-dépendant ou C'-indépendant C'-dépendant C'-indépendant

De plus, les titres d'anticorps spécifiques soulevés par la vaccination ADN sont inférieurs à ceux obtenus après vaccination avec une protéine recombinante. Cependant, les anticorps induits par l'immunisation par ADN présentent une plus grande affinité pour les épitopes natifs que les anticorps induits par des protéines recombinantes. En d'autres termes, l'immunisation par ADN induit une réponse qualitativement supérieure. Les anticorps peuvent être induits après une vaccination avec de l'ADN, alors que les vaccinations à base de protéines recombinantes nécessitent généralement un rappel. L'immunisation par ADN peut être utilisée pour biaiser le profil TH de la réponse immunitaire et donc l'isotype de l'anticorps, ce qui n'est pas possible avec une infection naturelle ou une immunisation par protéine recombinante.Les réponses d'anticorps générées par l'ADN sont utiles comme outil de préparation. Par exemple, des anticorps polyclonaux et monoclonaux peuvent être générés pour être utilisés comme réactifs.

Mécanisme d'absorption d'ADN

Lorsque l'absorption d'ADN et l'expression subséquente ont été démontrées pour la première fois in vivo dans les cellules musculaires, [51] ces cellules étaient considérées comme uniques en raison de leur vaste réseau de tubules en T. En utilisant la microscopie électronique, il a été proposé que l'absorption d'ADN était facilitée par des cavéoles (ou des piqûres non recouvertes de clathrine). [52] Cependant, des recherches ultérieures ont révélé que d'autres cellules (telles que les kératinocytes, les fibroblastes et les cellules épithéliales de Langerhans) pouvaient également internaliser l'ADN. [43] [53] Le mécanisme d'absorption d'ADN n'est pas connu.

Deux théories dominent – ​​que in vivo l'absorption de l'ADN se produit de manière non spécifique, dans une méthode similaire à la phago- ou à la pinocytose, [18] ou via des récepteurs spécifiques. [54] Ceux-ci pourraient inclure un récepteur de surface de 30 kDa, ou des récepteurs piégeurs de macrophages. Le récepteur de surface de 30 kDa se lie spécifiquement à des fragments d'ADN de 4 500 pb (qui sont ensuite internalisés) et se trouve sur les APC et les lymphocytes T professionnels. Les récepteurs piégeurs de macrophages se lient à une variété de macromolécules, y compris les polyribonucléotides et sont donc des candidats pour l'absorption d'ADN. [54] [55] L'absorption d'ADN médiée par les récepteurs pourrait être facilitée par la présence de séquences de polyguanylate. Les systèmes d'administration de pistolets à gènes, l'emballage de liposomes cationiques et d'autres méthodes d'administration contournent cette méthode d'entrée, mais sa compréhension peut être utile pour réduire les coûts (par exemple, en réduisant les besoins en cytofectines), ce qui pourrait être important en élevage.

Présentation de l'antigène par les cellules dérivées de la moelle osseuse

Des études utilisant des souris chimériques ont montré que l'antigène est présenté par des cellules dérivées de la moelle osseuse, qui comprennent des cellules dendritiques, des macrophages et des cellules B spécialisées appelées cellules présentatrices d'antigène professionnelles (APC). [46] [56] Après l'inoculation du canon à gènes sur la peau, les cellules de Langerhans transfectées migrent vers le ganglion lymphatique drainant pour présenter des antigènes. [7] Après injections IM et ID, les cellules dendritiques présentent un antigène dans le ganglion lymphatique drainant [53] et des macrophages transfectés ont été retrouvés dans le sang périphérique. [57]

Outre la transfection directe de cellules dendritiques ou de macrophages, l'amorçage croisé se produit après les livraisons d'ADN par IM, ID et canon à gènes. L'amorçage croisé se produit lorsqu'une cellule dérivée de la moelle osseuse présente des peptides provenant de protéines synthétisées dans une autre cellule dans le contexte du CMH de classe 1. Cela peut amorcer des réponses des lymphocytes T cytotoxiques et semble être important pour une réponse immunitaire primaire complète. [7] [58]

Rôle sur le site cible

L'administration d'ADN IM et ID initie différemment les réponses immunitaires. Dans la peau, les kératinocytes, les fibroblastes et les cellules de Langerhans captent et expriment des antigènes et sont responsables de l'induction d'une réponse primaire en anticorps. Les cellules de Langerhans transfectées migrent hors de la peau (dans les 12 heures) vers le ganglion lymphatique drainant où elles amorcent les réponses secondaires des lymphocytes B et T. Dans le muscle squelettique, les cellules musculaires striées sont le plus souvent transfectées, mais semblent être sans importance dans la réponse immunitaire. Au lieu de cela, l'ADN inoculé par IM « lave » dans le ganglion lymphatique de drainage en quelques minutes, où les cellules dendritiques distales sont transfectées, puis initient une réponse immunitaire. Les myocytes transfectés semblent agir comme un « réservoir » d'antigène pour le trafic des APC professionnelles. [18] [51] [58]

Maintien de la réponse immunitaire

La vaccination par ADN génère une mémoire immunitaire efficace via la présentation de complexes antigène-anticorps sur les cellules dendritiques folliculaires (FDC), qui sont de puissants stimulateurs des cellules B. Les cellules T peuvent être stimulées par des cellules dendritiques du centre germinatif similaires. Les FDC sont capables de générer une mémoire immunitaire car la production d'anticorps « chevauche » l'expression à long terme de l'antigène, permettant aux complexes immuns antigène-anticorps de se former et d'être affichés par FDC. [7]

Interférons

Les cellules T auxiliaires et cytotoxiques peuvent contrôler les infections virales en sécrétant des interférons. Les cellules T cytotoxiques tuent généralement les cellules infectées par un virus. Cependant, ils peuvent également être stimulés pour sécréter des cytokines antivirales telles que l'IFN-γ et le TNF-α, qui ne tuent pas la cellule, mais limitent l'infection virale en régulant à la baisse l'expression des composants viraux. [59] Les vaccinations par ADN peuvent être utilisées pour freiner les infections virales par un contrôle non destructif à médiation par l'IFN. Cela a été démontré pour l'hépatite B. [60] L'IFN-γ est d'une importance cruciale dans le contrôle des infections palustres [61] et constitue une considération pour les vaccins antipaludiques à ADN.

Modulation des cytokines

Un vaccin efficace doit induire une réponse immunitaire appropriée pour un agent pathogène donné. Les vaccins à ADN peuvent polariser l'aide des lymphocytes T vers les profils TH1 ou TH2 et générer des CTL et/ou des anticorps si nécessaire. Ceci peut être accompli par des modifications de la forme de l'antigène exprimé (c'est-à-dire intracellulaire vs sécrété), de la méthode et de la voie d'administration ou de la dose. [38] [39] [62] [63] [64] Elle peut également être accomplie par la co-administration d'ADN plasmidique codant pour des molécules de régulation immunitaire, c'est-à-dire des cytokines, des lymphokines ou des molécules de co-stimulation. Ces « adjuvants génétiques » peuvent être administrés sous forme de :

  • mélange de 2 plasmides, l'un codant pour l'immunogène et l'autre codant pour la cytokine
  • vecteur unique bi- ou polycistronique, séparé par des régions d'espacement
  • chimère codée par un plasmide ou protéine de fusion

En général, la co-administration d'agents pro-inflammatoires (tels que diverses interleukines, facteur de nécrose tumorale et GM-CSF) et de cytokines induisant le TH2 augmente les réponses en anticorps, tandis que les agents pro-inflammatoires et les cytokines induisant le TH1 diminuent les réponses humorales et augmentent réponses cytotoxiques (plus importantes dans la protection virale). Des molécules co-stimulantes telles que B7-1, B7-2 et CD40L sont parfois utilisées.

Ce concept a été appliqué à l'administration topique d'ADNp codant pour l'IL-10. [30] Le plasmide codant pour B7-1 (un ligand sur les APC) a amélioré avec succès la réponse immunitaire dans les modèles tumoraux. Mélange de plasmides codant pour le GM-CSF et la protéine circumsporozoïte de P. yoelii (PyCSP) a amélioré la protection contre une provocation ultérieure (alors que PyCSP codé par le plasmide seul ne l'a pas fait). Il a été proposé que le GM-CSF amène les cellules dendritiques à présenter l'antigène plus efficacement et à améliorer la production d'IL-2 et l'activation des cellules TH, entraînant ainsi une réponse immunitaire accrue. [47] Cela peut être encore amélioré par un premier amorçage avec un mélange pPyCSP et pGM-CSF, suivi d'un rappel avec un poxvirus recombinant exprimant PyCSP. [65] Cependant, la co-injection de plasmides codant pour le GM-CSF (ou IFN-γ, ou IL-2) et une protéine de fusion de P.chabaudi la protéine de surface du mérozoïte 1 (extrémité C)-protéine de surface du virus de l'hépatite B (PcMSP1-HBs) a aboli la protection contre la provocation, par rapport à la protection acquise par la délivrance de pPcMSP1-HBs seul. [27]

Les avantages des adjuvants génétiques sont leur faible coût et leur administration simple, ainsi que l'évitement des cytokines recombinantes instables et des adjuvants « classiques » potentiellement toxiques (tels que l'alun, le phosphate de calcium, le monophosphoryl lipide A, la toxine cholérique, les liposomes cationiques et enrobés de mannane. , QS21, carboxyméthylcellulose et ubénimix). [7] [18] Cependant, la toxicité potentielle de l'expression prolongée de cytokines n'est pas établie. Chez de nombreuses espèces animales d'importance commerciale, les gènes de cytokine n'ont pas été identifiés et isolés. De plus, diverses cytokines codées par des plasmides modulent différemment le système immunitaire en fonction du temps d'administration. Par exemple, certains ADN plasmidiques de cytokines sont mieux délivrés après l'ADNp d'immunogène, car la pré- ou la co-administration peut diminuer les réponses spécifiques et augmenter les réponses non spécifiques. [66]

Motifs CpG immunostimulants

L'ADN plasmidique lui-même semble avoir un effet adjuvant sur le système immunitaire. [6] [7] L'ADN dérivé de bactéries peut déclencher des mécanismes de défense immunitaire innés, l'activation des cellules dendritiques et la production de cytokines TH1. [42] [67] Ceci est dû à la reconnaissance de certaines séquences dinucléotidiques CpG qui sont immunostimulantes. [63] [68] Les séquences stimulatrices CpG (CpG-S) se produisent vingt fois plus fréquemment dans l'ADN dérivé de bactéries que dans les eucaryotes. En effet, les eucaryotes présentent une « suppression CpG », c'est-à-dire que les paires de dinucléotides CpG se produisent beaucoup moins fréquemment que prévu. De plus, les séquences CpG-S sont hypométhylées. Cela se produit fréquemment dans l'ADN bactérien, tandis que les motifs CpG apparaissant chez les eucaryotes sont méthylés au niveau du nucléotide de la cytosine. En revanche, les séquences nucléotidiques qui inhibent l'activation d'une réponse immunitaire (appelées CpG neutralisant, ou CpG-N) sont surreprésentées dans les génomes eucaryotes. [69] La séquence immunostimulante optimale est un dinucléotide CpG non méthylé flanqué de deux purines 5' et de deux pyrimidines 3'. [63] [67] De plus, les régions flanquantes en dehors de cet hexamère immunostimulant doivent être riches en guanine pour assurer la liaison et l'absorption dans les cellules cibles.

Le système inné travaille avec le système immunitaire adaptatif pour monter une réponse contre la protéine codée par l'ADN. Les séquences CpG-S induisent l'activation polyclonale des cellules B et la régulation positive de l'expression et de la sécrétion des cytokines. [70] Les macrophages stimulés sécrètent IL-12, IL-18, TNF-α, IFN-α, IFN-β et IFN-γ, tandis que les cellules B stimulées sécrètent IL-6 et un peu d'IL-12. [18] [70] [71]

La manipulation des séquences CpG-S et CpG-N dans le squelette plasmidique des vaccins à ADN peut assurer le succès de la réponse immunitaire à l'antigène codé et conduire la réponse immunitaire vers un phénotype TH1. Ceci est utile si un agent pathogène nécessite une réponse TH pour la protection. Les séquences CpG-S ont également été utilisées comme adjuvants externes pour la vaccination à la fois par l'ADN et les protéines recombinantes avec des taux de réussite variables. D'autres organismes avec des motifs CpG hypométhylés ont démontré la stimulation de l'expansion des cellules B polyclonales. [ citation requise ] Le mécanisme derrière cela peut être plus compliqué que la simple méthylation - l'ADN murin hypométhylé n'a pas été trouvé pour monter une réponse immunitaire.

La plupart des preuves des séquences CpG immunostimulantes proviennent d'études murines. L'extrapolation de ces données à d'autres espèces requiert de la prudence - les espèces individuelles peuvent nécessiter des séquences flanquantes différentes, car les spécificités de liaison des récepteurs charognards varient d'une espèce à l'autre. De plus, des espèces telles que les ruminants peuvent être insensibles aux séquences immunostimulantes en raison de leur charge gastro-intestinale importante.

Boosts alternatifs

Les réponses immunitaires amorcées par l'ADN peuvent être amplifiées par l'administration de protéines recombinantes ou de poxvirus recombinants. Les stratégies « Prime-boost » avec des protéines recombinantes ont réussi à augmenter à la fois le titre d'anticorps neutralisants, ainsi que l'avidité et la persistance des anticorps, pour les immunogènes faibles, tels que la protéine d'enveloppe du VIH-1. [7] [72] Il a été démontré que les poussées de virus recombinants sont très efficaces pour stimuler les réponses CTL amorcées par l'ADN. L'amorçage avec l'ADN concentre la réponse immunitaire sur l'immunogène requis, tandis que le rappel avec le virus recombinant fournit une plus grande quantité d'antigène exprimé, conduisant à une forte augmentation des réponses CTL spécifiques.

Les stratégies Prime-boost ont réussi à induire une protection contre le défi du paludisme dans un certain nombre d'études. Souris amorcées avec un codage d'ADN plasmidique Plasmodium yoelii la protéine de surface du circumsporozoïte (PyCSP), puis stimulée avec un virus de la vaccine recombinant exprimant la même protéine avait des niveaux significativement plus élevés d'anticorps, d'activité CTL et d'IFN-γ, et donc des niveaux de protection plus élevés, que les souris immunisées et stimulées avec de l'ADN plasmidique seul. [73] Cela peut être encore amélioré par un amorçage avec un mélange de plasmides codant pour PyCSP et GM-CSF murin, avant un rappel avec le virus de la vaccine recombinant. [65] Une stratégie efficace de prime-boost pour le modèle de paludisme simien P. knowlesi a également été démontré. [74] Des singes rhésus ont été amorcés avec un vaccin à ADN à plusieurs composants et à plusieurs stades codant pour deux antigènes au stade hépatique - la protéine de surface du circumsporozoïte (PkCSP) et la protéine de surface du sporozoïte 2 (PkSSP2) - et deux antigènes au stade sanguin - la protéine de surface du mérozoïte apicale 1 ( PkAMA1) et la protéine de surface du mérozoïte 1 (PkMSP1p42). Ils ont ensuite été stimulés avec un virus canarypox recombinant codant pour les quatre antigènes (ALVAC-4). Les singes immunisés ont développé des anticorps contre les sporozoïtes et les érythrocytes infectés, et des réponses des lymphocytes T sécrétant de l'IFN-γ contre les peptides de PkCSP. Une protection partielle contre la provocation par les sporozoïtes a été obtenue et la parasitémie moyenne a été significativement réduite par rapport aux singes témoins. Ces modèles, bien qu'ils ne soient pas idéaux pour l'extrapolation à P. falciparum chez l'homme, sera important dans les essais précliniques.

Améliorer les réponses immunitaires

L'efficacité de l'immunisation par ADN peut être améliorée en stabilisant l'ADN contre la dégradation et en augmentant l'efficacité de la délivrance d'ADN dans les cellules présentatrices d'antigène. [7] Cela a été démontré en enrobant des microparticules cationiques biodégradables (telles que le poly(lactide-co-glycolide) formulé avec du bromure de cétyltriméthylammonium) avec de l'ADN. De telles microparticules recouvertes d'ADN peuvent être aussi efficaces pour élever les CTL que les virus recombinants, en particulier lorsqu'elles sont mélangées avec de l'alun. Les particules de 300 nm de diamètre semblent être les plus efficaces pour l'absorption par les cellules présentatrices d'antigène. [7]

Vecteurs d'alphavirus

Des vecteurs à base d'alphavirus recombinants ont été utilisés pour améliorer l'efficacité de la vaccination par ADN. [7] Le gène codant pour l'antigène d'intérêt est inséré dans le réplicon d'alphavirus, remplaçant les gènes structuraux mais laissant intacts les gènes de réplicase non structuraux. Le virus Sindbis et le virus de la forêt Semliki ont été utilisés pour construire des réplicons d'alphavirus recombinants. Contrairement aux vaccinations à ADN conventionnelles, les vecteurs alphavirus tuent les cellules transfectées et ne sont exprimés que de manière transitoire. Les gènes de réplicase d'alphavirus sont exprimés en plus de l'insert de vaccin. Il n'est pas clair comment les réplicons d'alphavirus augmentent une réponse immunitaire, mais cela peut être dû aux niveaux élevés de protéines exprimées par ce vecteur, aux réponses cytokiniques induites par les réplicons ou à l'apoptose induite par les réplicons conduisant à une meilleure absorption d'antigène par les cellules dendritiques.


Les MET1b gène codant pour une ADN de maintenance méthyltransférase est indispensable au développement normal du riz

Tandis que Arabidopsis n'en porte qu'un MET1 gène codant pour l'ADN méthyltransférase qui est principalement responsable du maintien de la méthylation de la CG après la réplication de l'ADN, le riz porte deux MET1 gènes, MET1a et MET1b, exprimé dans les cellules se répliquant et se divisant activement, et MET1b est plus abondamment exprimé que MET1a. UNE met1a null mutant affiché aucun phénotype manifeste, ce qui implique que MET1b doit jouer un rôle majeur dans le maintien de la méthylation de l'ADN. Ici, nous avons employé deux met1b mutants nuls, générés par le ciblage knock-in induit par recombinaison homologue et l'insertion d'un rétrotransposon endogène Tos17. Ces MET1a/MET1a met1b/met1b les homozygotes présentaient des phénotypes de graines anormaux, qui sont associés soit à une germination vivipare, soit à une létalité embryonnaire précoce. Ils ont également affiché une diminution des niveaux de méthylation de l'ADN au niveau des séquences CentO répétitives et au FIE1 locus du gène dans les embryons. De plus, des plantes ciblées knock-in isolées de manière indépendante, dans lesquelles le GUS le gène rapporteur a été fusionné avec le gène endogène MET1b promoteur, a montré les modèles d'expression reproductibles, dose-dépendants et spatio-temporels de GUS. L'analyse du génotypage de la descendance autofécondée d'hétérozygotes met1a met1b des mutants nuls ont indiqué que MET1a faiblement actif semble servir de mécanisme de sauvegarde génétique chez le riz met1b gamétophytes, bien que l'activation stochastique et non coordonnée des mécanismes de sauvegarde épigénétique se soit produite moins efficacement dans le met1b homozygotes du riz que dans le rencontré1 homozygotes de Arabidopsis. De plus, l'épuisement passif de la méthylation de la CG au cours de la réplication de l'ADN postméiotique dans les noyaux haploïdes du met1a met1b les gamétophytes dans le riz entraînent une létalité embryonnaire précoce. Cette situation ressemble un peu à celle de la rencontré1 gamétophytes dans Arabidopsis.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Exploiter des séquences d'ADN uniques

La présence de séquences d'ADN uniques permet aux scientifiques d'identifier des séquences de signature qui peuvent ensuite être utilisées comme sondes pour détecter des organismes individuels ou pour détecter un gène particulier. Des changements d'une seule paire de bases peuvent être facilement détectés par la plupart des techniques d'hybridation et par séquençage. Les séquences de signature sont particulièrement importantes pour le diagnostic des virus, qui sont les agents pathogènes dépourvus de gènes ribosomiques ou mitochondriaux. Leur détection et leur identification sont grandement simplifiées en utilisant ces séquences, car les méthodes traditionnelles peuvent prendre jusqu'à quelques semaines.

Les séquences d'ADN uniques peuvent également être utilisées pour concevoir des amorces (courts fragments d'ADN nécessaires pour initier l'amplification de l'ADN) pour la réaction en chaîne par polymérase (PCR). Il existe une différence adéquate entre tous les gènes d'un organisme, ainsi qu'entre les organismes de différentes espèces, pour garantir que les amorces sélectionnées n'amplifieront que la séquence cible même si un mélange de différentes molécules d'ADN est présent. Cela permet aux scientifiques de concevoir des tests de diagnostic et d'identification pour les agents pathogènes et les maladies courants et pour des parties du génome de l'agent pathogène.

Identification des personnes. Bien que chaque personne ait un ADN unique (à l'exception des jumeaux identiques), l'identification des personnes n'est pas basée sur le séquençage du génome de quelqu'un. Au lieu de cela, l'analyse de l'ADN mitochondrial dans une région d'une boucle de déplacement (boucle D ou région de contrôle) ou de courtes répétitions en tandem (STR) est utilisée à des fins d'identification. L'analyse en boucle D est utilisée pour l'identification individuelle dans l'analyse médico-légale. Ceci est possible en raison des polymorphismes de telles séquences résultant de substitutions de paires de bases au cours du processus de réplication de l'ADN (par exemple, au lieu de A, l'ADN polymérase incorpore T).

La région de la boucle D a une longueur de 1274 paires de bases et est située entre les gènes codant pour l'ARN de transfert (ARNt) pour la proline et l'ARNt pour la phénylalanine et contient les régions régulatrices des autres gènes de réplication.

La principale méthode utilisée pour l'identification des changements dans cette région est l'amplification et le séquençage par PCR. Cependant, de nouvelles approches de puces à ADN sont en cours de développement.

Encodage des messages secrets. Les séquences d'ADN offrent une méthode unique de cryptage des messages ou de dissimulation d'informations. Une séquence d'ADN codant pour un message est flanquée sur les sites d'amorces qui seront ensuite utilisées pour l'amplifier par PCR et séquence.Un code de cryptage est sélectionné par un groupe qui utilise le système, par exemple, chaque lettre et chaque numéro peuvent se voir attribuer trois paires de bases. Le brin d'ADN avec un message est préparé et mélangé avec de l'ADN génomique humain fractionné à la même taille que le message. Pour dissimuler davantage l'ADN d'un ennemi, l'ADN d'une autre espèce peut être ajouté. Un destinataire prévu du message peut le décoder par amplification PCR et séquençage. L'envoi d'un tel message est aussi simple que d'écrire une lettre et de joindre le message codé par ADN sous la forme d'un micropoint. Une fois le mélange d'ADN préparé, il est repéré sur un point sur du papier à partir duquel les micropoints sont découpés et attachés aux points de la lettre. Si une telle lettre tombe entre de mauvaises mains, il sera extrêmement difficile de trouver un message, car il sera enterré parmi des millions d'autres, et il sera impossible de le lire sans les séquences d'introduction et le code de cryptage.

Les messages cryptés par ADN peuvent être utilisés pour conserver des informations importantes, mais aussi pour transmettre des informations d'espionnage. Bien que la méthode soit simple, elle nécessite un équipement de biologie moléculaire pour le décoder et peut être trop gênante pour une utilisation quotidienne.


Résultats

Différences de population dans les profils de méthylation de l'ADN des monocytes primaires

Pour évaluer les différences de population dans la méthylation de l'ADN d'un type de cellules immunitaires innées purifiées, nous avons caractérisé la variation de la méthylation de l'ADN à > 850 000 sites CpG à travers le génome, dans les monocytes provenant de 156 hommes volontaires sains : 78 d'origine africaine (AFB, âge médian = 30,9 ans ) et 78 d'origine européenne (EUB, âge médian = 25,9 ans), tous vivant en Belgique. Notez que les individus AFB ont déménagé en Belgique entre 6 et 45 ans (âge médian = 29 ans). Après normalisation et filtrage (voir « Matériels et méthodes »), nous avons retenu un ensemble de données final de 552 141 sites de méthylation chez les 156 individus (Fichier supplémentaire 1 : Figure S1). L'analyse en composantes principales (ACP) de la méthylation de l'ADN séparait clairement AFB et EUB le long des deux premiers CP, ce qui expliquait ensemble 11,6 % de la variance totale (Fig. 1a). À un taux de fausses découvertes (FDR) = 1%, nous avons identifié 77 857 sites (14,1% du nombre total) qui présentaient une différence significative entre AFB et EUB dans leur niveau moyen de méthylation de l'ADN, après ajustement pour l'âge et les variables de substitution. En restreignant nos analyses aux CpG qui présentaient une différence moyenne > 5% (mesurée par le ?? valeur [68], voir « Matériaux et méthodes »), nous avons identifié un total de 12 050 sites à méthylation différentielle entre les populations (DMS) qui correspondent à 4818 gènes. Parce que les distributions d'âge des individus AFB et EUB diffèrent significativement (Wilcoxon P valeur = 10 -4 Fichier supplémentaire 1 : Figure S2), et l'âge pourrait avoir un effet non linéaire sur la méthylation de l'ADN [69], nous avons également étudié avec ANOVA dans quelle mesure la méthylation de l'ADN est affectée de manière non linéaire par l'âge dans notre ensemble de données . Nos analyses ont montré que ces effets avaient peu ou pas d'impact sur les différences de population dans la méthylation de l'ADN détectée (Fichier supplémentaire 2 : Note supplémentaire 1).

Différences de population dans les profils de méthylation de l'ADN. une Analyse en composantes principales (ACP) des profils de méthylation de l'ADN pour les 156 individus. Les cercles rouges et bleus représentent respectivement les individus africains (AFB) et européens (EUB). Les proportions de variance expliquées par PC1 et PC2 sont indiquées. b Localisation génomique des sites différentiellement méthylés (DMS), pour les sites CpG hyper-méthylés dans AFB (rouge) et dans EUB (bleu). Le rapport de cotes et les intervalles de confiance à 95 % sont affichés pour AFB-DMS et EUB-DMS, en comparant leur localisation dans différents emplacements génomiques fournis par Illumina (TSS1500, TSS200, 5′UTR, 1stExon, Body, Exon bounds [ExonBnd] et 3 ′UTR), et dans les régions amplificatrices et promotrices spécifiquement détectées dans les monocytes par ChromHMM phase 15 (voir références [110, 111]). Les rapports de cotes ont été calculés par rapport à la distribution générale des 552 141 CpG de notre ensemble de données. c Proportion de DMS hyperméthylés soit chez les individus AFB (rouge) soit chez les individus EUB (bleu). La densité de ?? les valeurs d'un site CpG par catégorie sont données à titre d'illustration des différences de population, avec des lignes rouges et bleues représentant la densité de méthylation dans AFB et EUB, respectivement. Analyses d'enrichissement de l'ontologie génique (GO) d'AFB- et EUB-DMS. Pour les deux groupes, les catégories top-GO atteignant 5% FDR sont affichées, ainsi que le nombre de gènes par catégorie et le journal10-enrichissement ajusté FDR transformé P valeurs

La distribution génomique des DMS, qui étaient fortement enrichies en régions amplificatrices (rapport de cotes (OR)

2.6, P = 1,42 × 10 −224 ), était indépendant de la population où l'hyperméthylation a été observée (Fig. 1b). Cependant, sur les 12 050 DMS, 76,3 % étaient plus méthylés dans les BAAR que dans les EUB, par rapport aux 54 % observés en considérant tous les CpG (le chiffre exact de Fisher P < 2,2 × 10 −16 ) (Fig. 1c). Les gènes correspondants ont été enrichis dans des catégories d'ontologie génétique (GO) liées à la périphérie cellulaire et à la membrane plasmique (Fig. 1d). Les 23,7 % restants, qui étaient hyperméthylés dans EUB, étaient enrichis dans des sites situés dans des gènes largement associés à la régulation de la réponse immunitaire et aux réponses aux stimuli externes (Fig. 1c, d Fichier supplémentaire 3 : Tableau S1). Ces résultats ne peuvent pas être expliqués par des différences de population dans les sous-populations de monocytes (c.haute/CD16négatif [Classique], CD14haute/CD16meugler [Intermédiaire], et CD14meugler/CD16haute [Non-Classique]), car l'ajout de ces sous-populations comme covariables dans le modèle n'a pas modifié nos résultats (Fichier supplémentaire 1 : Figure S3). De plus, nous n'avons détecté aucun site CpG dont les niveaux de méthylation sont en corrélation significative avec les sous-types de monocytes (FDR = 5%), indiquant que les effets des sous-populations de monocytes sur la méthylation de l'ADN sont négligeables au niveau de l'épigénome. Ensemble, ces analyses révèlent des gènes et des fonctions qui présentent des différences importantes dans la méthylation de l'ADN entre les individus d'ascendance africaine et européenne, dans le contexte des monocytes primaires.

Les facteurs génétiques sont à l'origine de la plupart des variations de méthylation de l'ADN liées à l'ascendance

Nous avons ensuite examiné les déterminants génétiques des différences observées entre les populations dans la méthylation de l'ADN et cartographié les loci de traits quantitatifs de méthylation (meQTL). Nous avons d'abord testé les associations locales entre la variation de la méthylation de l'ADN au niveau des CpG et des SNP situés dans une fenêtre de 100 kb (cis-meQTLs), en utilisant MatrixEQTL [70] (voir « Matériaux et méthodes »). Nous avons fixé un seuil FDR de 5%, en considérant une association par site CpG et en utilisant 100 permutations (P < 1 × 10 -5 ). Nous avons ajusté pour l'âge, deux variables de substitution (prenant en compte les effets de lot et les facteurs de confusion inconnus, voir « Matériels et méthodes »), et les deux premiers PC des données génétiques (Fichier supplémentaire 1 : Figure S4), pour tenir compte de la stratification de la population. Pour détecter les effets subtils, nous avons fusionné tous les individus et inclus l'ascendance comme covariable, mais simultanément, nous avons analysé les deux populations séparément pour détecter des effets putatifs spécifiques à la population. Pour toutes les analyses ultérieures, nous présentons les résultats significatifs de ces deux approches combinées, sauf indication contraire.

Nous avons identifié 69 702 CpG associés à au moins une variante génétique dans au moins une population (

12,6 % de tous les sites, appelés meQTL-CpGs). Étant donné que plusieurs SNP liés peuvent être associés au même CpG, nous avons conservé le SNP le mieux associé pour chaque meQTL-CpG. Cependant, nous avons également utilisé une approche de cartographie fine [51] pour détecter des SNP indépendants associés à chaque CpG (voir « Matériaux et méthodes »). Ce faisant, nous avons détecté 9826 meQTL supplémentaires (Fichier supplémentaire 1 : Figure S5), offrant une vue plus approfondie de la contribution des variantes génétiques proches à la variation de la méthylation de l'ADN. La distance médiane entre un CpG et son SNP associé était

3,8 ko (Fichier supplémentaire 1 : Figure S6), supportant le contrôle génétique étroit de la méthylation de l'ADN [22, 28, 41, 65]. De plus, nous avons trouvé un enrichissement de 2,2 fois des meQTL-CpG dans les amplificateurs (P < 1 × 10 −326), une tendance encore plus prononcée pour les meQTL associés aux différences de population dans la méthylation de l'ADN (meQTL-DMS OR

2.8, P = 6,8 × 10 −317 , Fichier supplémentaire 1 : Figure S7).

En nous concentrant sur les différences liées à l'ascendance, nous avons observé que

70,2% des DMS hébergent un meQTL significatif, par rapport aux 12,6% détectés à l'échelle du génome (Fisher’s exact P < 2,2 × 10 −16 Fig. 2a). Ces meQTL se sont avérés expliquer, en moyenne,

58 % des différences observées dans la population dans la méthylation de l'ADN (Fichier supplémentaire 1 : Figure S8, voir « Matériaux et méthodes »). De plus, les meQTL présentaient des effets opposés sur la méthylation de l'ADN en fonction des différences de population dans la fréquence allélique, c'est-à-dire qu'un allèle dérivé à une fréquence plus élevée chez les Africains était généralement associé à des niveaux élevés de méthylation de l'ADN, tandis qu'un allèle dérivé à une fréquence plus élevée chez les Européens était principalement associée à une faible méthylation de l'ADN (Fig. 2b). Cette observation fournit une explication génétique aux schémas déséquilibrés d'hyperméthylation, observés au DMS, entre Africains et Européens (Fig. 1c).

Contrôle génétique des différences de population dans les niveaux de méthylation de l'ADN. une Proportions de CpG et DMS associées aux variants génétiques identifiés dans les trois études meQTL : fusion des deux populations (nuances de gris), cartographie en AFB uniquement (nuances rouges) et en EUB uniquement (nuances bleues). Pour chaque cartographie, les proportions parmi les 552 141 sites CpG testés et parmi les DMS sont indiquées en couleurs claires et foncées, respectivement. ***Fiche exacte P < 2,2 × 10 −16 . b Graphique de contour des effets meQTL sur le DMS en fonction de leur différence de fréquences alléliques dérivées (DAF) entre les populations. Pour chacun des 8459 DMS pour lesquels nous avons détecté au moins un meQTL, nous avons utilisé une estimation de densité de noyau pour tracer le tracé de contour de l'effet de l'allèle dérivé du meQTL sur la méthylation (bêta, Oui axe) selon le ΔDAF (DAFEUB – DAFAFB, X axe). Le coefficient et P valeur du test de corrélation de Pearson sont affichées. La distribution marginale des deux variables est affichée : en haut pour ΔDAF, et à droite pour bêta. c, Exemples de meQTL détectés dans cette étude. Les boxplots représentent la distribution de ?? valeurs en fonction du génotype, pour les individus AFB (rouge) et EUB (bleu). La fréquence des allèles mineurs de chaque meQTL est présentée pour chaque population en haut. Les lignes grises indiquent le modèle de régression linéaire ajusté pour ?? valeur

génotype pour chaque population. e Enrichissement en plis des meQTL associés au DMS dans les hits GWAS. Pour chacune des 17 catégories d'EFO parentales, le facteur d'enrichissement, les intervalles de confiance à 95 % obtenus par bootstrap, et les P les valeurs sont affichées

Les meQTL locaux peuvent, a priori, conduire à des différences de population dans la méthylation de l'ADN suivant deux modèles principaux : (i) le meQTL a un effet similaire dans les deux populations mais présente des fréquences alléliques différentes (Fig. 2c), ou (ii) le meQTL est présent à des fréquences similaires mais affichent des effets spécifiques à la population, révélant des interactions plus complexes (Fig. 2d). Nous avons donc étudié la spécificité de population des 69 702 meQTL-CpG détectés en utilisant une approche de sélection de modèle (voir « Matériels et méthodes »). Nous avons trouvé 2868 (4,1%) effets significatifs spécifiques à la population (1337 spécifiques aux BAAR et 1531 spécifiques aux EUB), suggérant l'apparition d'effets G × E ou G × G.

Les meQTL liés à l'ascendance sont enrichis en associations avec des traits et des maladies complexes

Étant donné qu'une grande partie des variants génétiques identifiés par GWAS agiraient en affectant la régulation des gènes [71,72,73,74], nous avons étudié l'impact fonctionnel putatif des meQTL détectés sur les phénotypes complexes ultimes. En pratique, nous avons recherché des enrichissements dans les hits GWAS parmi notre ensemble de 79 528 meQTL, en corrigeant le déséquilibre de liaison (voir « Matériels et méthodes »). En nous concentrant sur les 17 classes parentales de la classification Experimental Factor Ontology (EFO) [75], nous avons constaté que les meQTL étaient enrichis en hits significatifs pour toutes ces catégories fonctionnelles (Fichier supplémentaire 1 : Figure S9, OU

2.1–5.5, P < 4,1 × 10 -10 ). Des enrichissements plus importants ont été détectés pour les meQTL associés à des différences de population dans la méthylation de l'ADN (OR

2.7–9.8, P < 2,9 × 10 −3 ), en particulier pour les phénotypes liés aux mesures hématologiques, aux troubles neurologiques, aux troubles du système immunitaire, aux mesures inflammatoires et aux troubles du système digestif (Fig. 2e).

Étant donné que la méthylation de l'ADN et les meQTL se sont avérés largement dépendants des cellules ou des tissus [23, 76, 77, 78, 79, 80, 81], nous avons ensuite recherché les traits spécifiques qui expliquent les signaux détectés dans la catégorie parentale « immune trouble du système », étant donné notre concentration sur les monocytes primaires. Nous avons constaté que les meQTL chevauchaient des variantes associées à des maladies telles que l'arthrose, le psoriasis, le lupus érythémateux disséminé, les maladies inflammatoires de la peau ou le diabète de type 1 (Fichier supplémentaire 1 : Figure S10). Par exemple, le SNP meQTL rs629953 présente des fréquences très différentes entre AFB et EUB (DAF AFB 7,5% contre DAF EUB 62%), conduisant à une méthylation variable de l'ADN au niveau de la population à TNFAIP3 (cg06987098), et a été associée à une susceptibilité au psoriasis [82, 83]. Ensemble, nos analyses soutiennent que les traits complexes et la méthylation variable de l'ADN sont associés de manière pléiotropique à la variation génétique [39, 60, 63, 64], mais étendent ces associations à des variantes affectant la variation épigénétique liée à l'ascendance dans le contexte d'un type cellulaire d'immunité innée.

Explorer le contrôle génétique à distance de la variation de la méthylation de l'ADN

Nous avons ensuite recherché les effets de variants génétiques distants sur la variation de la méthylation de l'ADN (trans-meQTLs). Pour limiter le fardeau des tests multiples, et parce que trans-meQTLs sont enrichis en cis-eQTLs pour les gènes codant pour les facteurs de transcription (TF) [65], nous nous sommes concentrés sur deux sous-ensembles non indépendants de variants génétiques : (i) les 4037 SNP détectés comme cis-eQTL pour l'un des 600 gènes codant pour le TF et, plus généralement, (ii) les 73 561 SNP situés au voisinage (± 10 kb) du TSS de ces gènes. Seules les associations pour lesquelles la distance SNP-CpG était supérieure à 1 Mb ont été considérées, à un FDR de 5% (P < 1 × 10 -9 ). Compte tenu de la puissance généralement faible pour cartographier trans-associations, nous avons effectué cette analyse en considérant tous les individus ensemble et en incluant l'ascendance comme covariable.

Nous avons identifié 133 sites CpG associés à au moins un SNP distant, pour un total de 672 trans-meQTLs qui impliquaient 91 loci indépendants (Fichier supplémentaire 4 : Tableau S2). Parmi ceux-ci, nous avons détecté un certain nombre de hubs de contrôle génétique distant de la variation de la méthylation de l'ADN, dont six TF (ZNF429, CTCF, FOXI1, ZBTB25, MKL2, et NFATC1) où la variation génétique locale était associée à au moins 10 CpG différents dans trans. Soulignant un exemple pertinent, une seule variante génétique (rs7203742) à proximité CTCF— encodant un régulateur transcriptionnel avec 11 domaines en doigt de zinc hautement conservés — contrôle le degré de méthylation de l'ADN sur 30 sites CpG,

29,4 % de tous les CpG réglementés en trans. De plus, sur les 21 trans-CpG régulés qui ont été détectés comme DMS, 12 ont été contrôlés par le même CTCF une variante. Que cette variante (T → C) présente des niveaux élevés de différenciation de population (DAF AFB 24% vs EUB 88%, FST = 0,59 dans les 1% de la distribution pangénomique) suggère l'action de sélection positive ciblant l'allèle dérivé chez les Européens. Cette observation fait de CTCF non seulement un régulateur principal de la méthylation de l'ADN, comme précédemment observé [65], mais aussi un contributeur important aux différences de méthylation de l'ADN entre les populations humaines.

Disséquer les relations mécanistiques entre la méthylation de l'ADN et l'expression des gènes

Nous avons tiré parti de la disponibilité des données de séquençage de l'ARN des mêmes individus [48] pour obtenir de nouvelles informations sur les relations mécanistiques entre la méthylation de l'ADN et la variation de l'expression des gènes, chez les individus africains et européens. Nous avons associé les niveaux d'expression de 12 578 gènes dans les monocytes primaires à ceux de la méthylation de l'ADN au niveau des CpG situés à moins de 100 kb de leur TSS, pour un total de 513 536 sites CpG. Les associations étaient considérées comme significatives si elles passaient un P seuil de valeur déterminé à l'aide de 100 permutations (FDR = 5%, P < 5 × 10 −5 ) (voir « Matériaux et méthodes »).

Nous avons identifié 1666 CpG dont les niveaux de méthylation de l'ADN étaient associés à l'expression génique (eQTM), pour un total de 811 gènes (eQTM-gènes) associés à au moins un CpG dans un groupe de population (Fichier supplémentaire 5 : Tableau S3). Les voies KEGG associées aux gènes eQTM contenaient un grand nombre de voies liées au système immunitaire, fournissant un lien entre la méthylation de l'ADN et l'expression des gènes dans le contexte de l'immunité (Fig. 3a). Lors de l'étude de la spécificité de la population des 811 eQTM (voir « Matériels et méthodes »), nous avons détecté 93 effets significatifs spécifiques à la population (43 spécifiques aux BAAR et 50 spécifiques aux EUB). La majorité de ces cas (80 sur 93) correspondaient à des gènes dont les eQTM étaient également sous contrôle génétique, suggérant, là encore, la survenue d'interactions G × G ou G × E.

Corrélations de la méthylation de l'ADN avec l'expression des gènes. une Réseaux de voies KEGG de gènes détectés dans la cartographie eQTM. b Localisation génomique des eQTM, pour les sites CpG associés positivement et négativement (respectivement jaune clair et jaune foncé). Les rapports de cotes ont été calculés par rapport à la distribution générale des 552 141 CpG de notre ensemble de données. La distribution des eQTM selon la direction de leur effet sur l'expression des gènes est montrée. c Proportions des différents groupes de sites CpG dans tous les sites testés (panneau de gauche) et parmi les eQTM détectés (panneau de droite)

Sur la base des annotations génomiques actuelles, les eQTM étaient pour la plupart négativement corrélées à l'expression des gènes (69,5 % contre 30,5 %, voir également les références [23, 28, 65, 84, 85]). Les sites corrélés négativement étaient fortement enrichis en activateurs (OR

2.6, P = 6,6 × 10 −59 ) (Fig. 3b), mettant en évidence leur rôle majeur dans la régulation transcriptionnelle [86,87,88]. De plus, nous avons trouvé un léger excès d'associations négatives chez les promoteurs (OR

1.2, P = 1,8 × 10 −2 ) et TSS à proximité (TSS1500) (OU

1.4, P = 7,2 × 10 −13 ), comme prévu selon le modèle canonique. A l'inverse, les associations positives se sont enrichies dans les sites situés à proximité des UTR, en particulier 3'-UTR (OR

1.8, P = 8,4 × 10 −5 ) [89], mais appauvri en sites localisés dans les promoteurs (OR

0.6, P = 1,1 × 10 −4 ) (Fig. 3b). De plus, nous avons constaté que les eQTM étaient fortement enrichis en DMS (OR

11.8, P < 1,93 × 10 −216 ) et, surtout, en meQTL-CpGs (OU

33.2, P < 1 × 10 -326 ) (Fig. 3c). Ensemble, ces observations indiquent que la variation de la méthylation de l'ADN, en particulier sur les sites qui sont méthylés de manière différentielle entre les populations (DMS), est beaucoup plus susceptible d'être sous contrôle génétique lorsqu'elle est associée à des différences d'expression génique (eQTM), que les sites CpG aléatoires.

Explorer la causalité sous-jacente entre les loci de régulation et l'expression des gènes

Parce que les rôles respectifs des facteurs génétiques et épigénétiques dans la régulation transcriptionnelle ne sont pas entièrement compris [56], nous avons ensuite cartographié les eQTL (FDR = 5%, voir « Matériaux et méthodes ») pour identifier les cas où la méthylation de l'ADN, l'expression des gènes et les variantes montrent des associations significatives entre toutes les paires (Fichier supplémentaire 1 : Figure S11). Nous avons ainsi obtenu 552 trios, chacun d'entre eux constitué d'un gène, un à divers CpG et un à divers SNP (contenant 68,1 % des gènes détectés dans la cartographie eQTM). Cela suggérait des relations causales potentielles entre ces variables - une question latente, bien que difficile, en épigénétique. Pour déduire la causalité entre les loci régulateurs (c. un SNP et (ii) une variabilité d'expression génique attribuable à la méthylation de l'ADN pour les trios présentant plus d'un CpG (voir « Matériels et méthodes »).

Nous avons utilisé une approche bayésienne [90] pour évaluer les effets causaux potentiels d'une variable médiatrice M (méthylation de l'ADN) sur la relation entre une variable indépendante X (génétique) et une variable dépendante Oui (expression génique) [91]. En comparant les performances de cette méthode avec celles d'une approche basée sur des corrélations partielles, utilisant des données simulées et divers scénarios génomiques, nous avons trouvé des résultats similaires entre les deux approches en termes de sensibilité et de spécificité (Fig. 4a, b Fichier supplémentaire 1 : Figure S12 voir « Matériels et méthodes »). Nous avons ensuite effectué l'analyse de médiation sur chaque trio, en ajustant pour les covariables régulières (variables d'âge et de substitution), mais aussi pour les quatrième et deuxième CP de l'expression des gènes et de la méthylation de l'ADN, respectivement. Ces dernières covariables ont été ajoutées car elles capturent probablement des facteurs de confusion potentiels induisant une corrélation entre la méthylation et l'expression de l'ADN, ce qui violerait l'hypothèse du modèle d'inférence causale (Fichier supplémentaire 1 : Figure S13). Notez que la causalité inverse s'est avérée peu probable dans notre cadre expérimental et n'a donc pas été prise en compte dans nos analyses (Fichier supplémentaire 2 : Note supplémentaire 2).

Inférence des effets causaux de la méthylation de l'ADN sur la régulation des gènes. une Représentation d'un scénario simulé, avec les trois paramètres variables (??, ??, et ??). b Comparaison de l'analyse de médiation (med) avec une approche de corrélation partielle (PartCor) en utilisant une gamme de différents paramètres simulés pour ?? (0.3–0.8), ?? (0,9-0,1), et ?? (0,1-0,9). Notez que la plage de paramètres simulée pour ?? et ?? a été ajusté de manière à conserver 75 % de la variance inexpliquée (paramètre de bruit aléatoire ?? = 0,25). La différence de l'aire sous la courbe (AUC) entre les deux approches est représentée avec différentes nuances de rouge et de bleu. Les tailles des cercles sont proportionnelles à l'AUC moyenne des deux approches. Deux exemples de courbes ROC sont présentés dans la partie supérieure de la figure. c Nombre de gènes eQTM médiés et non médiés pour les associations négatives et positives entre la méthylation de l'ADN et l'expression des gènes. Les pourcentages de ces deux catégories sont également indiqués. Proportion de variance de l'expression génique expliquée par la méthylation de l'ADN (gris clair) et la génétique (gris foncé), dans les cas médiés et non médiés

À FDR = 5%, nous avons identifié 165 gènes où le contrôle génétique des niveaux d'expression a été médié par la méthylation de l'ADN (c'est-à-dire, ?? × ?? était significativement différent de zéro, figure 4a), dans au moins une population. Remarquablement, dans 66 de ces cas, la médiation a eu lieu via des sites CpG qui sont méthylés différemment selon les populations (DMS) (Fichier supplémentaire 6 : Tableau S4). La proportion de gènes médiés dont l'expression était positivement et négativement corrélée à la méthylation de l'ADN était similaire, allant de 26 à 31% (Fig. 4c). Comme on pouvait s'y attendre, nous avons constaté que, parmi les gènes médiés, la méthylation de l'ADN expliquait une proportion significativement plus élevée de la variance de l'expression génique que la génétique (moyenne R 2 = 23,4% contre 15,4%, respectivement Wilcoxon P = 3,3 × 10 −11 ), contrairement aux 387 cas non médiatisés où nous avons observé la tendance inverse (Wilcoxon P = 7,8 × 10 −37 ) (Fig. 4d).

Nous avons également constaté que les sites CpG médiateurs de l'expression des gènes étaient préférentiellement situés dans les amplificateurs (OR

2.5, P = 4,0 × 10 −21 ), soulignant à nouveau le rôle majeur de ces régions dans les mécanismes de régulation épigénétique [92,93,94]. Ces CpG étaient appauvris en promoteurs (OR

0.7, P = 1,4 × 10 −2 ), qui étaient par ailleurs enrichis en CpG non médiateurs (OR

1.3, P = 5,9 × 10 -3 ). Notamment, 86,6% des CpG médiateurs sont tombés directement dans un site de liaison TF (TFBS), par rapport aux 76,9% attendus au niveau du génome (OR

1.9, l'exact de Fisher P = 8,64 × 10 −7 ). Ce résultat suggère que la méthylation de l'ADN pourrait réguler activement l'activité transcriptionnelle par la modulation de la liaison TF, une hypothèse qui nécessite une validation expérimentale.

Fait intéressant, parmi les cas médiés, nous avons trouvé des gènes clés de la réponse immunitaire, tels que NLRP2, RAI14, NCF4, ou ICAM4, et des gènes ayant des fonctions liées à l'activité transcriptionnelle, codant pour des protéines à doigt de zinc (Fichier supplémentaire 6 : Tableau S4). Cela suggère un rôle plus important de la méthylation de l'ADN dans la régulation de l'expression des gènes que les associations locales décrites ici, par le biais de la régulation de l'activité des protéines de liaison à l'ADN.

Impact des perturbations immunitaires sur les interactions génétiques et épigénétiques

Enfin, nous avons cherché à comprendre comment la variation de la méthylation de l'ADN à l'état basal affecte les réponses transcriptionnelles à l'activation immunitaire. Nous avons utilisé des données de séquençage d'ARN, obtenues à partir des mêmes individus, après exposition à divers stimuli : LPS activant TLR4 et Pam3CSK4 activant TLR1/2, les deux voies détectant les composants bactériens, R848 activant TLR7/8, détectant principalement les acides nucléiques viraux, et la grippe A virus (IAV) [48]. Nous avons ensuite cartographié les réponses QTM (reQTM) en utilisant des changements de pli dans l'expression des gènes entre les états non stimulés et stimulés, pour tous les gènes exprimés dans l'une ou l'autre des conditions (voir « Matériaux et méthodes »).

Nous avons trouvé 230 gènes uniques dont la réponse à l'activation immunitaire était associée à la méthylation de l'ADN dans au moins une condition, la plupart des associations étaient spécifiques au contexte, avec seulement 7 gènes détectés dans toutes les conditions (Fig. 5a Fichier supplémentaire 5 : Tableau S3). En outre, une augmentation de 2,5 fois a été observée dans le nombre de gènes reQTM détectés lors de l'activation avec des stimuli viraux (gènes uniques R848 et IAV 197) par rapport à ceux détectés pour les ligands bactériens (gènes uniques LPS et Pam3CSK4 78) (Fig. 5a). Par exemple, nous avons détecté un reQTM lors de la stimulation R848 pour CARTE9 en EUB et CD1D lors de l'infection par l'IAV dans les BAAR, les deux gènes sont connus pour jouer un rôle important dans la défense de l'hôte (Fig. 5b, c). Bien que les reQTM et les eQTM présentent une distribution génomique similaire (Fichier supplémentaire 1 : Figure S14), nous avons observé un changement important vers des associations positives entre la méthylation de l'ADN et les réponses transcriptionnelles, en particulier aux ligands TLR (Fig. 5d). Ce décalage s'explique principalement par les reQTM qui présentent les associations les plus fortes entre la méthylation de l'ADN et l'expression des gènes dans la condition non stimulée (Fichier supplémentaire 1 : Figure S15), correspondant à 109 gènes (47 % du total). Ceci contraste avec le modèle canonique d'associations négatives principalement observé au niveau des reQTM présentant les associations les plus fortes à l'état stimulé, correspondant à 131 gènes (57% du total). Notez que 10 gènes étaient associés aux reQTM des deux groupes.

Effets de la méthylation de l'ADN sur les réponses transcriptionnelles à la stimulation immunitaire. une Nombre de gènes hébergeant des reQTM dans des conditions uniques ou des combinaisons de stimulations. b, c Exemples de reQTM détectés dans cette étude. Les lignes indiquent le modèle de régression linéaire ajusté et en gris les intervalles de confiance à 95 % de ces modèles. b La distribution des valeurs d'expression de CD1D au niveau non stimulé (jaune) et après infection par l'IAV (violet) est tracé en fonction de ?? valeurs, pour les individus AFB seulement. c La distribution des valeurs d'expression de CARTE9 à la stimulation non stimulée (jaune) et à la stimulation R848 (bleu) est tracée en fonction de ?? valeurs, pour les individus EUB uniquement. Nombre de gènes reQTM par condition et selon la direction de leur association avec la méthylation de l'ADN. e Nombre de gènes reQTM médiés et non médiés par condition de stimulation. Les pourcentages de ces deux catégories pour chaque condition sont également indiqués. F Proportion de variance de l'expression génique expliquée par la méthylation de l'ADN, parmi les associations négatives (couleurs sombres) et positives (couleurs claires), dans les cas médiés

Pour explorer les effets de médiation causale de la méthylation de l'ADN dans le contexte de l'activation immunitaire, nous avons cartographié les QTL de réponse (voir « Matériaux et méthodes »). Suivant notre justification précédente (Fichier supplémentaire 1 : Figure S11), nous avons identifié 141 trios (61,3 % des 230 gènes reQTM, Fichier supplémentaire 6 : Tableau S4). À FDR = 5%, nous avons détecté 40 gènes (28,4%) où le contrôle génétique de leur réponse transcriptionnelle était médié par la méthylation de l'ADN (Fig. 5e). Bien que non significatif, nous avons trouvé une proportion plus élevée de médiation pour les gènes dont la réponse était positivement associée à la méthylation de l'ADN, par rapport aux associations négatives, en particulier pour les provocations virales (OR

2,0 exacte de Fisher P = 0,33) (Fichier supplémentaire 1 : Figure S16). Parmi les gènes médiés dans les conditions virales, la proportion de variance d'expression génique expliquée par la méthylation de l'ADN était plus élevée pour les associations positives que pour les associations négatives, encore une fois en contradiction avec la condition non stimulée (Fig. 5f). Plus généralement, nos analyses illustrent l'intérêt de cartographier les reQTM et d'étudier les modèles de causalité sous-jacents, pour découvrir les mécanismes qui pourraient expliquer les disparités dans la façon dont les individus et les populations répondent à l'activation immunitaire.


Des morceaux d'ADN mystérieux, loin d'être « indésirables », jouent un rôle crucial

Parmi les nombreux mystères de la biologie humaine, il y a la raison pour laquelle des maladies complexes comme le diabète, l'hypertension artérielle et les troubles psychiatriques sont si difficiles à prévoir et, souvent, à traiter. Un casse-tête tout aussi déroutant est de savoir pourquoi un individu contracte une maladie comme le cancer ou la dépression, alors qu'un jumeau identique reste en parfaite santé.

Maintenant, les scientifiques ont découvert un indice essentiel pour résoudre ces énigmes. Le génome humain regorge d'au moins quatre millions de commutateurs génétiques qui résident dans des morceaux d'ADN qui étaient autrefois considérés comme des « poubelles », mais qui s'avèrent jouer un rôle essentiel dans le contrôle du comportement des cellules, des organes et d'autres tissus. La découverte, considérée comme une percée médicale et scientifique majeure, a d'énormes implications pour la santé humaine, car de nombreuses maladies complexes semblent être causées par de minuscules changements dans des centaines de commutateurs génétiques.

Les résultats, qui sont le fruit d'un immense projet fédéral impliquant 440 scientifiques de 32 laboratoires du monde entier, auront des applications immédiates pour comprendre comment les altérations des parties non génétiques de l'ADN contribuent aux maladies humaines, qui peuvent à leur tour conduire à de nouvelles médicaments. Ils peuvent également aider à expliquer comment l'environnement peut affecter le risque de maladie. Dans le cas de jumeaux identiques, de petits changements dans l'exposition environnementale peuvent légèrement modifier les commutateurs génétiques, avec pour résultat qu'un jumeau contracte une maladie et l'autre non.

Au fur et à mesure que les scientifiques fouillaient les « poubelles » – des parties de l'ADN qui ne sont pas de vrais gènes contenant des instructions pour les protéines – ils ont découvert un système complexe qui contrôle les gènes. Au moins 80 pour cent de cet ADN est actif et nécessaire. Le résultat du travail est une feuille de route annotée d'une grande partie de cet ADN, notant ce qu'il fait et comment. Il comprend le système d'interrupteurs qui, agissant comme des gradateurs d'éclairage, contrôlent quels gènes sont utilisés dans une cellule et quand ils sont utilisés, et déterminent, par exemple, si une cellule devient une cellule hépatique ou un neurone.

"C'est Google Maps", a déclaré Eric Lander, président du Broad Institute, une entreprise de recherche conjointe de Harvard et du Massachusetts Institute of Technology. En revanche, le prédécesseur du projet, le Human Genome Project, qui déterminait la séquence entière de l'ADN humain, "était comme obtenir une image de la Terre depuis l'espace", a-t-il déclaré. « Ça ne vous dit pas où sont les routes, ça ne vous dit pas à quoi ressemble la circulation à quelle heure de la journée, ça ne vous dit pas où sont les bons restaurants, ou les hôpitaux ou les villes ou les rivières . "

Le nouveau résultat "est une ressource étonnante", a déclaré le Dr Lander, qui n'était pas impliqué dans la recherche qui l'a produit mais était un chef de file du projet du génome humain. "Ma tête explose devant la quantité de données."

Les découvertes ont été publiées mercredi dans six articles de la revue Nature et dans 24 articles dans Genome Research et Genome Biology. En outre, The Journal of Biological Chemistry publie six articles de synthèse et Science publie un autre article.

L'ADN humain est "beaucoup plus actif que prévu, et il se passe beaucoup plus de choses que prévu", a déclaré Ewan Birney du Laboratoire européen de biologie moléculaire-Institut européen de bioinformatique, chercheur principal sur le projet.

Dans l'un des articles de Nature, les chercheurs associent les commutateurs génétiques à une gamme de maladies humaines - sclérose en plaques, lupus, polyarthrite rhumatoïde, maladie de Crohn, maladie cœliaque - et même à des traits comme la taille. Dans de grandes études au cours de la dernière décennie, les scientifiques ont découvert que des changements mineurs dans les séquences d'ADN humain augmentent le risque qu'une personne contracte ces maladies. Mais ces changements étaient des déchets, maintenant souvent appelés matière noire - ce n'étaient pas des changements dans les gènes - et leur signification n'était pas claire. La nouvelle analyse révèle qu'un grand nombre de ces changements modifient les commutateurs génétiques et sont très importants.

"La plupart des changements qui affectent la maladie ne résident pas dans les gènes eux-mêmes, mais dans les commutateurs", a déclaré Michael Snyder, chercheur à l'Université de Stanford pour le projet, appelé Encode, pour Encyclopedia of DNA Elements.

Et cela, a déclaré le Dr Bradley Bernstein, chercheur en code au Massachusetts General Hospital, "est vraiment un gros problème". Il a ajouté: "Je ne pense pas que quiconque ait prédit que ce serait le cas."

Les découvertes peuvent également révéler quels changements génétiques sont importants dans le cancer, et pourquoi. Alors qu'ils commençaient à déterminer les séquences d'ADN des cellules cancéreuses, les chercheurs ont réalisé que la plupart des milliers de modifications de l'ADN dans les cellules cancéreuses n'étaient pas dans les gènes, mais dans la matière noire. Le défi consiste à déterminer lesquels de ces changements sont à l'origine de la croissance du cancer.

Image

"Ces articles sont très importants", a déclaré le Dr Mark A. Rubin, chercheur en génomique du cancer de la prostate au Weill Cornell Medical College. Le Dr Rubin, qui ne faisait pas partie du projet Encode, a ajouté : « Ils auront certainement un impact sur notre recherche médicale sur le cancer.

Dans le cancer de la prostate, par exemple, son groupe a découvert des mutations dans des gènes importants qui ne sont pas facilement attaqués par les médicaments. Mais Encode, en montrant quelles régions de la matière noire contrôlent ces gènes, donne un autre moyen de les attaquer : cibler ceux qui contrôlent les commutateurs.

Le Dr Rubin, qui a également utilisé l'analogie de Google Maps, a expliqué : « Maintenant, vous pouvez suivre les routes et voir la circulation. C’est exactement de la même manière que nous utiliserons ces données dans la recherche sur le cancer. » Encode fournit une feuille de route avec des schémas de circulation pour d'autres moyens de s'attaquer aux gènes du cancer, a-t-il déclaré.

Le Dr Bernstein a déclaré : « C'est une ressource, comme le génome humain, qui fera avancer la science. »

Le système, cependant, est incroyablement complexe, avec de nombreuses redondances. L'idée d'autant de commutateurs était presque incompréhensible, a déclaré le Dr Bernstein.

Il existe également une sorte de système de câblage ADN qui est presque inconcevablement complexe.

"C'est comme ouvrir une armoire électrique et voir une boule de poils de fils", a déclaré Mark Gerstein, un chercheur d'Encode à Yale. "Nous avons essayé de démêler cette boule de poils et de la rendre interprétable."

Il existe également une autre sorte de boule de poils : la structure tridimensionnelle complexe de l'ADN. L'ADN humain est un si long brin - environ 10 pieds d'ADN enfoui dans le noyau microscopique d'une cellule - qu'il ne tient que parce qu'il est étroitement enroulé et enroulé sur lui-même. Lorsqu'ils ont examiné la structure tridimensionnelle - la boule de poils - les chercheurs d'Encode ont découvert que de petits segments d'ADN de matière noire sont souvent assez proches des gènes qu'ils contrôlent. Dans le passé, lorsqu'ils n'analysaient que la longueur non enroulée de l'ADN, les régions de contrôle semblaient éloignées des gènes qu'elles affectaient.

Le projet a débuté en 2003, lorsque les chercheurs ont commencé à comprendre à quel point ils en savaient peu sur l'ADN humain. Ces dernières années, certains ont commencé à trouver des commutateurs dans les 99 % de l'ADN humain qui ne sont pas des gènes, mais ils ne pouvaient pas complètement caractériser ou expliquer ce que faisait la grande majorité de celui-ci.

L'idée avant le début du projet, a déclaré Thomas Gingeras, un chercheur d'Encode du laboratoire Cold Spring Harbor, était que seulement 5 à 10 pour cent de l'ADN d'un être humain était réellement utilisé.

La grande surprise était non seulement que la quasi-totalité de l'ADN est utilisée, mais aussi qu'une grande partie de celui-ci est constituée de commutateurs génétiques. Avant Encode, a déclaré le Dr John Stamatoyannopoulos, un scientifique de l'Université de Washington qui faisait partie du projet, « si vous aviez dit que la moitié du génome et probablement plus d'instructions pour activer et désactiver les gènes, je ne pense pas que les gens auraient vous a cru.

Au moment où le National Human Genome Research Institute, qui fait partie des National Institutes of Health, s'est lancé dans Encode, des avancées majeures dans le séquençage de l'ADN et la biologie computationnelle avaient rendu envisageable d'essayer de comprendre la matière noire de l'ADN humain. Même ainsi, l'analyse était intimidante - les chercheurs ont généré 15 000 milliards d'octets de données brutes. L'analyse des données a nécessité l'équivalent de plus de 300 ans de temps informatique.

Le simple fait d'organiser les chercheurs et de coordonner le travail était une entreprise énorme. Le Dr Gerstein, l'un des chefs de file du projet, a produit un diagramme des auteurs avec leurs liens les uns avec les autres. Cela semble presque aussi compliqué que le schéma de câblage des commutateurs ADN humains. Maintenant, cette partie du travail est terminée et les centaines d'auteurs ont rédigé leurs articles.

"Il y a littéralement une flottille de papiers", a déclaré le Dr Gerstein. Mais, a-t-il ajouté, il reste encore du travail à faire – il reste encore des parties du génome qui n'ont pas été découvertes.


Comment fonctionne l'ADN

L'ADN contient toutes les informations relatives à vos caractéristiques physiques, qui sont essentiellement déterminées par les protéines. Ainsi, l'ADN contient les instructions pour fabriquer une protéine. Dans l'ADN, chaque protéine est codée par un gène (une séquence spécifique de nucléotides d'ADN qui spécifient comment une seule protéine doit être fabriquée). Plus précisément, l'ordre des nucléotides dans un gène spécifie l'ordre et les types d'acides aminés qui doivent être assemblés pour fabriquer une protéine.

Une protéine est constituée d'une longue chaîne de produits chimiques appelés acides aminés Les protéines ont de nombreuses fonctions :

  • Enzymes qui effectuent des réactions chimiques (telles que les enzymes digestives)
  • Protéines structurelles qui sont des matériaux de construction (tels que le collagène et la kératine des ongles)
  • Protéines de transport qui transportent des substances (telles que l'hémoglobine transportant l'oxygène dans le sang)
  • Protéines de contraction qui provoquent la compression des muscles (comme l'actine et la myosine)
  • Protéines de stockage qui retiennent des substances (telles que l'albumine dans les blancs d'œufs et la ferritine stockant le fer dans la rate)
  • Les hormones - messagers chimiques entre les cellules (y compris l'insuline, les œstrogènes, la testostérone, le cortisol, etc.)
  • Protéines protectrices - anticorps du système immunitaire, protéines de coagulation dans le sang
  • Toxines - substances vénéneuses (telles que le venin d'abeille et le venin de serpent)

La séquence particulière d'acides aminés dans la chaîne est ce qui rend une protéine différente d'une autre. Cette séquence est codée dans l'ADN où un gène code pour une protéine.

Comment l'ADN code-t-il les informations d'une protéine ? Il n'y a que quatre bases d'ADN, mais il y a 20 acides aminés qui peuvent être utilisés pour les protéines. Ainsi, des groupes de trois nucléotides forment un mot (codons) qui spécifie lequel des 20 acides aminés entre dans la protéine (un codon à 3 bases donne 64 modèles possibles (4*4*4), ce qui est plus que suffisant pour spécifier 20 acides aminés. Parce qu'il y a 64 codons possibles et seulement 20 acides aminés, il y a une certaine répétition dans le code génétique. De plus, l'ordre des codons dans le gène spécifie l'ordre des acides aminés dans la protéine. Il peut nécessiter de 100 à 1 000 codons (300 à 2 000 nucléotides) pour spécifier un protéine donnée. Chaque gène possède également des codons pour désigner le début (démarrer le codon) et fin (codon d'arrêt) du gène.


Remerciements

Nous remercions Shivani Nautiyal et S. Jarrett Wrenn pour la lecture critique du manuscrit et les discussions utiles tout au long de ce travail Elizabeth Zuo pour la synthèse des oligonucléotides et l'analyse par spectrométrie de masse et Mai Nguyen pour la synthèse des oligonucléotides. DRH est chercheur prédoctoral au Howard Hughes Medical Institute. Ce travail a été financé par un Stanford Office of Technology Licensing Research Incentive Award (#127P304 à PBH) et un Burroughs-Wellcome Fund New Investigator in the Pharmacological Sciences Award (#1001162 à PBH).