Informations

Prédictions TFBS pour la levure et la pombe ?

Prédictions TFBS pour la levure et la pombe ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Existe-t-il des ressources pour les prédictions TFBS (transcription factor binding site) pour la levure (S. cerevisiae) et S. pombe génomes ? Même si ce ne sont que de novo prédictions, j'aimerais y avoir accès.


Essayez YEASTRACT http://www.yeastract.com/

YEASTRACT (Yeast Search for Transcriptional Regulators And Consensus Tracking) est un référentiel organisé de plus de 48333 associations régulatrices entre les facteurs de transcription (TF) et les gènes cibles chez Saccharomyces cerevisiae, basé sur plus de 1200 références bibliographiques. Il comprend également la description de 298 sites de liaison à l'ADN spécifiques pour plus d'une centaine de TF caractérisées.


Cette question est assez ancienne, mais je pense qu'il pourrait être utile de mentionner ceci:

Vous pouvez également consulter RSAT (Regulatory Sequence Analysis Tools) :

aller dans le portail Fungi, dans "découverte des motifs" choisir "oligo-analyse"; là, vous pouvez prédire le TFBS putatif à partir de séquences en amont par exemple. Il détecte les motifs répétés. Pour être plus précis de Saccharomyces cerevisiae ou S. pombe, sélectionnez ces espèces dans la section "Modèle de fond".


M:Explorer : les modèles de régression multinomiale révèlent des régulateurs positifs et négatifs de la longévité dans la quiescence des levures

Nous avons développé m:Explorer pour identifier les facteurs de transcription (TF) spécifiques au processus à partir de plusieurs sources à l'échelle du génome, y compris les données de transcriptome, de liaison à l'ADN et de chromatine. m:Explorer surpasse de manière robuste des techniques similaires pour trouver des TF du cycle cellulaire dans Saccharomyces cerevisiae. Nous avons prédit et testé expérimentalement des régulateurs de quiescence (G0), un modèle de vieillissement, sur une durée de six semaines. Nous avons validé neuf des 12 meilleures prédictions en tant que roman G0 TF, y compris Δmga2,cst6,bas1 avec une viabilité plus élevée et G0-les TF essentielles Tup1, Swi3. L'analyse des voies associe la longévité à une croissance réduite, un métabolisme reprogrammé et un remodelage de la paroi cellulaire. m:Explorer (http://biit.cs.ut.ee/mexplorer/) contribue à interroger les systèmes de régulation eucaryotes à l'aide de données hétérogènes.


Identification des facteurs de transcription coopératifs chez la levure à l'aide de plusieurs sources de données

Fond: La régulation transcriptionnelle de l'expression génique est généralement accomplie par de multiples facteurs de transcription interactifs (TF). Par conséquent, il est crucial de comprendre les interactions coopératives précises entre les TF. Divers types de données expérimentales, y compris la puce ChIP, le site de liaison TF (TFBS), l'expression génique, le knock-out de TF et les données d'interaction protéine-protéine ont été utilisés pour identifier des paires de TF coopératives dans les méthodes existantes. Les données d'occupation des nucléosomes ne sont pas encore utilisées pour ce sujet de recherche malgré que plusieurs recherches aient révélé l'association entre les nucléosomes et les TFBS.

Résultats: Dans cette étude, nous avons développé une nouvelle méthode pour déduire la coopérativité entre deux TF en intégrant la régulation documentée du gène TF, le TFBS et les données d'occupation des nucléosomes. La régulation documentée du gène TF et les données TFBS ont été utilisées pour déterminer les gènes cibles d'un TF, et les données d'occupation des nucléosomes à l'échelle du génome ont été utilisées pour évaluer l'occupation des nucléosomes sur les TFBS. Notre méthode identifie des paires de TF coopératives sur la base de deux hypothèses biologiquement plausibles. Si deux TF coopèrent, alors (i) ils devraient avoir un nombre significativement plus élevé de gènes cibles communs que l'attente aléatoire et (ii) leurs sites de liaison (dans les promoteurs de leurs gènes cibles communs) devraient avoir tendance à être co-appauvris en nucléosomes dans afin de rendre ces sites de liaison simultanément accessibles à la liaison TF. Chaque paire TF se voit attribuer un score de coopérativité par notre méthode. Plus le score est élevé, plus une paire TF est susceptible d'être coopérative. Enfin, une liste de 27 paires de TF coopératives a été prédite par notre méthode. Parmi ces 27 paires TF, 19 paires sont également prédites par les méthodes existantes. Les 8 autres paires sont de nouvelles paires TF coopératives prédites par notre méthode. La pertinence biologique de ces 8 nouvelles paires de TF coopératives est justifiée par l'existence d'interactions protéine-protéine et de co-annotation dans les mêmes catégories fonctionnelles MIPS. De plus, nous avons adopté trois indices de performance pour comparer nos prédictions avec 11 prédictions de méthodes existantes. Nous montrons que notre méthode fonctionne mieux que ces 11 méthodes existantes pour identifier des paires de TF coopératives chez la levure. Enfin, le réseau TF coopératif construit à partir des 27 paires TF coopératives prédites montre que notre méthode a le pouvoir de trouver des paires TF coopératives de différents processus biologiques.

Conclusion: Notre méthode est efficace pour identifier des paires de TF coopératives dans la levure. Beaucoup de nos prédictions sont validées par la littérature, et notre méthode surpasse 11 méthodes existantes. Nous pensons que notre étude aidera les biologistes à comprendre les mécanismes de régulation transcriptionnelle dans les cellules eucaryotes.


Historique des modifications

Jorgensen, P. et al. Cartographie génétique à haute résolution avec des matrices ordonnées de Saccharomyces cerevisiae mutants de délétion. La génétique 162, 1091–1099 (2002).

Hillenmeyer, M.E. et al. Le portrait génomique chimique de la levure : découvrir un phénotype pour tous les gènes. Science 320, 362–365 (2008).

Giaever, G. et al. Profilage fonctionnel du Saccharomyces cerevisiae génome. La nature 418, 387–391 (2002).

Winzeler, E.A. et al. Caractérisation fonctionnelle du S. cerevisiae génome par délétion de gène et analyse parallèle. Science 285, 901–906 (1999).

Entian, K.D. & Kotter, P. Méthodes en microbiologie 36, éd. II. 629-666 (Elsevier, 2007).

Kittler, R. et al. Profilage ARNi à l'échelle du génome de la division cellulaire dans les cellules de culture de tissus humains. Nat. Cell Biol. 9, 1401–1412 (2007).

Wood, V. et al. La séquence du génome de Schizosaccharomyces pombe. La nature 415, 871–880 (2002).

Fisk, D.G. et al. Saccharomyces cerevisiae Annotation du génome S288C : une hypothèse de travail. Levure 23, 857–865 (2006).

Wach, A., Brachat, A., Pohlmann, R. & Philippsen, P. Nouveaux modules hétérologues pour les perturbations géniques classiques ou basées sur la PCR dans Saccharomyces cerevisiae. Levure 10, 1793–1808 (1994).

Gregan, J. et al. De nouveaux gènes nécessaires à la ségrégation méiotique des chromosomes sont identifiés par un écran knock-out à haut débit dans la levure à fission. Cour. Biol. 15, 1663–1669 (2005).

Martin-Castellanos, C. et al. Un écran grand format en S. pombe identifie sept nouveaux gènes requis pour les événements méiotiques critiques. Cour. Biol. 15, 2056–2062 (2005).

Decottignies, A., Sanchez-Perez, I. & Infirmière, P. Schizosaccharomyces pombe gènes essentiels : une étude pilote. Génome Res. 13, 399–406 (2003).

Smith, H.O., Hutchison, CA. III, Pfannkoch, C. & Venter, J.C. Génération d'un génome synthétique par assemblage de génome entier : bactériophage phiX174 à partir d'oligonucléotides synthétiques. Proc. Natl. Acad. Sci. Etats-Unis 100, 15440–15445 (2003).

Sipiczki, M. Où se trouve la levure de fission sur l'arbre de vie ? Génome Biol. 1, revues 1011.1–1011.4 (2000).

Bois, V. Schizosaccharomyces pombe génomique comparative de la séquence aux systèmes, dans Comparative Genomics: Using Fungi as Models (éd. Sunnerhagen, P. & Piskur, J.), 233-285 (Springer Berlin, Heidelberg, 2006).

Jeffares, D.C., Penkett, C.J. & Bahler, J. Les gènes à régulation rapide sont pauvres en introns. Tendances Genet. 24, 375–378 (2008).

Matsuyama, A. et al. Clonage ORFeome et analyse globale de la localisation des protéines chez la levure à fission Schizosaccharomyces pombe. Nat. Biotechnologie. 24, 841–847 (2006).

Euh, W.K. et al. Analyse globale de la localisation des protéines chez la levure bourgeonnante. La nature 425, 686–691 (2003).

Benton, M.J. & Ayala, F.J. Rencontre avec l'arbre de vie. Science 300, 1698–1700 (2003).

Hoskin, C.J., Higgie, M., McDonald, K.R. & Moritz, C. Le renforcement entraîne une spéciation allopatrique rapide. La nature 437, 1353–1356 (2005).

Harrison, R., Papp, B., Pal, C., Oliver, S.G. & Delneri, D. Plasticité des interactions génétiques dans les réseaux métaboliques de la levure. Proc. Natl. Acad. Sci. Etats-Unis 104, 2307–2312 (2007).

Chiron, S., Suleau, A. & Bonnefoy, N. Traduction mitochondriale : facteur d'élongation tu est essentiel dans la levure de fission et dépend d'un facteur d'échange conservé chez l'homme mais pas chez la levure bourgeonnante. La génétique 169, 1891–1901 (2005).

Choi, D.H., Oh, Y.M., Kwon, S.H. & Bae, S.H. La mutation d'un roman Saccharomyces cerevisiae Le gène SRL4 sauve la létalité des mutations rad53 et lcd1 en modulant les niveaux de dNTP. J. Microbiol. 46, 75–80 (2008).

Ralph, E., Boye, E. & Kearsey, S.E. Les dommages à l'ADN induisent la protéolyse de Cdt1 chez la levure à fission par une voie dépendante de Cdt2 et Ddb1. Représentant EMBO 7, 1134–1139 (2006).

Liu, C. et al. Les sous-unités Cop9/signalosome et Pcu4 régulent la ribonucléotide réductase par des mécanismes dépendants et indépendants des points de contrôle. Gènes Dev. 17, 1130–1140 (2003).

Preuss, D., Mulholland, J., Franzusoff, A., Segev, N. & Botstein, D. Caractérisation de la Saccharomyces Complexe de Golgi à travers le cycle cellulaire par immunomicroscopie électronique. Mol. Biol. Cellule 3, 789–803 (1992).

Ayscough, K., Hajibagheri, N.M., Watson, R. & Warren, G. Empilement des citernes de Golgi dans Schizosaccharomyces pombe nécessite des microtubules intacts. J. Cell Sci. 106, 1227–1237 (1993).

Roemer, T. et al. Identification à grande échelle des gènes essentiels dans Candida albicans et applications à la découverte de médicaments antifongiques. Mol. Microbiole. 50, 167–181 (2003).

Deutschbauer, A.M. et al. Mécanismes d'haploinsuffisance révélés par le profilage pangénomique chez la levure. La génétique 169, 1915–1925 (2005).

Pierce, S.E. et al. Une matrice de codes-barres moléculaire unique et universelle. Nat. Méthodes 3, 601–603 (2006).

Jozwiak, J., Jozwiak, S. & Wlodarski, P. Mécanismes possibles du développement de la maladie dans la sclérose tubéreuse. Lancet Oncol. 9, 73–79 (2008).

Cheng, K.W., Lahad, J.P., Gray, J.W. & Mills, G.B. Rôle émergent des RAB GTPases dans le cancer et les maladies humaines. Cancer Rés. 65, 2516–2519 (2005).

McGowan, K.A. et al. Les mutations ribosomiques provoquent une peau foncée médiée par p53 et des effets pléiotropes. Nat. Genet. 40, 963–970 (2008).

Lum, P.Y. et al. Découvrir des modes d'action pour des composés thérapeutiques à l'aide d'un criblage à l'échelle du génome d'hétérozygotes de levure. Cellule 116, 121–137 (2004).

Roguev, A. et al. Conservation et recâblage de modules fonctionnels révélés par une carte d'épistasie chez la levure à fission. Science 322, 405–410 (2008).

Dixon, S.J. et al. Conservation significative des réseaux d'interactions génétiques létales synthétiques entre des eucaryotes éloignés. Proc. Natl. Acad. Sci. Etats-Unis 105, 16653–16658 (2008).

Kamath, R.S. et al. Analyse fonctionnelle systématique du Caenorhabditis elegans génome utilisant l'ARNi. La nature 421, 231–237 (2003).

Dietzl, G. et al. Une bibliothèque d'ARNi transgénique à l'échelle du génome pour l'inactivation conditionnelle des gènes dans Drosophile. La nature 448, 151–156 (2007).

Ravi, D. et al. Un réseau de voies de survie aux dommages conservés révélés par un criblage d'ARNi génomique. PLoS Genet. 5, e1000527 (2009).

Bahler, J. et al. Modules hétérologues pour un ciblage génique efficace et polyvalent basé sur la PCR dans Schizosaccharomyces pombe. Levure 14, 943–951 (1998).

Moreno, S., Klar, A. & Nurse, P. Analyse génétique moléculaire de la levure à fission Schizosaccharomyces pombe. Méthodes Enzymol. 194, 795–823 (1991).

Styrkarsdottir, U., Egel, R. & Nielsen, O. La mutation smt-0 qui abolit la commutation de type d'accouplement chez la levure à fission est une délétion. Cour. Genet. 23, 184–186 (1993).

Elble, R. Une procédure simple et efficace pour la transformation des levures. Biotechnique 13, 18–20 (1992).

Boyle, E.I. et al. GO:TermFinder – un logiciel open source pour accéder aux informations sur l'ontologie génétique et trouver des termes d'ontologie génétique considérablement enrichis associés à une liste de gènes. Bioinformatique 20, 3710–3715 (2004).


Création d'une communauté Europe-Japon

S. pombe les liens de recherche entre l'Europe et le Japon ont été renforcés par plusieurs facteurs, notamment des collaborations, une migration accrue de chercheurs postdoctoraux entre les régions et la mise en place d'une série de conférences spécialement développées pour améliorer les interactions dans le domaine du cycle cellulaire entre les laboratoires du Japon et du Royaume-Uni . Comme mentionné ci-dessus, Richard Egel avait partagé de nombreuses souches mutantes avec Chikashi Shimoda, conduisant au clonage de gènes impliqués dans la méiose et la formation de spores. Pendant ce temps, Iain Hagan, qui avait effectué son doctorat. travail avec Jerry (Jeremy) Hyams (Figure 1) à l'University College London, puis a brièvement travaillé avec Nurse, est allé au Japon à la fin des années 1980 pour effectuer un travail postdoctoral avec Yanagida et à peu près au même moment, David Hughes, de Peter Fantes's ( Figure 1) laboratoire, a pris un poste postdoctoral avec Masayuki Yamamoto. Toutes ces interactions ont permis de jeter les bases d'une série de conférences qui ont renforcé les liens entre les laboratoires de levure de fission en Europe et au Japon.

Jerry Hyams, connu pour avoir développé des méthodes biochimiques et d'immunofluorescence pour S. pombe cellules dans les années 1980 (Marks et al. 1986), a joué un rôle central dans le renforcement des liens entre les laboratoires japonais et britanniques à travers des conférences organisées conjointement. En tant que coordinateur de la Society for General Microbiology, il a organisé une réunion sur S. pombe à Warwick en 1990. Il a contacté la Royal Society pour le financement des voyages des orateurs étrangers et a reçu une réponse négative jusqu'à ce que le nom de Mitsuhiro Yanagida soit mentionné. À ce stade, l'argent coulait librement du British Council, de la Royal Society et de son organisation sœur au Japon, la Japan Society for the Promotion of Science, soutenant l'atelier et permettant à Jerry de se rendre au Japon pour l'organiser. L'atelier a réuni des membres de la plupart des grandes S. pombe laboratoires dans le monde à l'époque, et une vingtaine de conférences ont été présentées sur 2 jours.

En plus de la réunion de Warwick en 1990, le British Council a apporté un soutien financier à la création d'une série d'ateliers sur le cycle cellulaire entre le Royaume-Uni et le Japon. Cela a commencé en 1992 et a été organisé par Yanagida et Hyams, avec un financement supplémentaire de la Kato Memorial Foundation. Bien qu'ayant un objectif plus large que juste S. pombe recherche, une proportion substantielle des participants étaient S. pombe chercheurs ayant un intérêt pour le cycle cellulaire. Ce schéma s'est poursuivi à travers des réunions assez régulières tous les 2-3 ans et a continué à renforcer les liens entre les deux pays.


Régions intergéniques

Les distributions totales des longueurs intergéniques pour S. pombe et S. cerevisiae sont illustrées à la Fig. 2. La longueur est calculée du codon d'arrêt au codon de démarrage suivant pour les gènes orientés en tandem, du codon de démarrage au codon de démarrage pour les gènes orientés de manière divergente, et du codon d'arrêt au codon d'arrêt pour les gènes orientés de manière convergente. gènes. Régions intergéniques dans S. pombe ont un mode de 423 pb et une moyenne de 952 pb, tous deux plus longs que les valeurs équivalentes pour S. cerevisiae (200 et 515 pb respectivement). L'analyse des régions intergéniques divergentes révèle que les paires de régions amont ont une longueur de 200 à 2 100 pb, avec un pic entre 200 et 1 200 pb (Fig. 2). Ceci est plus long que les distributions équivalentes dans S. cerevisiae, qui vont de 200 à 900 pb, avec un pic de 200 à 700 pb (Fig. 2). L'analyse des régions intergéniques convergentes montre un pic de longueur pour les paires de régions en aval de 200 à 800 pb pour S. pombe et 100-500 pb pour S. cerevisiae (Fig. 2). Il y a donc une différence plus faible entre les deux levures pour les régions intergéniques entre gènes convergents (régions en aval) que pour celles entre les gènes divergents (régions en amont).

Distribution des régions intergéniques donnée pour tous les gènes et pour les paires de gènes divergentes et convergentes, pour les deux S. pombe et S. cerevisiae. Un total de 4 890 régions intergéniques de S. pombe ont été analysés à partir d'une base de données préparée juste avant l'achèvement du génome entier, et 5 788 régions intergéniques de S. cerevisiae ont été analysés. Les histogrammes montrent le nombre de régions dans des bacs de 200 pb.

Plusieurs explications peuvent expliquer ces résultats. Les régions d'ARNm 5' peuvent être systématiquement plus longues dans S. pombe que dans S. cerevisiae, bien qu'il n'y ait aucune preuve pour cela. Par exemple, l'espacement entre la région TATA-box et le début de la transcription dans S. pombe est plus courte que celle de S. cerevisiae 58,59 . Alternativement, les régions promotrices peuvent être d'une plus grande complexité dans S. pombe et donc plus longtemps. Encore une fois, il n'y a aucune preuve directe pour étayer ce point de vue, mais il existe d'autres exemples d'organisation plus étendue des éléments de la chromatine dans S. pombe, y compris des centromères plus grands et des régions d' origine de réplication de l' ADN 60 . L'existence de régions espaceurs véritablement intergéniques dans S. pombe est étayée par l'identification de plusieurs régions étendues sans gène de 4 à 8 kb, qui se situent en dehors de la large distribution des longueurs associées aux régions intergéniques moyennes. Ce sont des séquences de faible complexité avec un commutateur de brin (G - C)/(G + C) 61 . Il y a environ dix régions sans gènes par chromosome, qui sont généralement flanquées de gènes orientés en tandem. L'une de ces régions sans gène, entre SPAC4G8.03c et SPAC4G8.04, correspond à un site de rupture d'ADN méiotique important ou à un groupe de sites (J. A. Young, R. W. Schreckhise et G. R. Smith, manuscrit en préparation).


La variante pyruvate kinase de la levure à fission ajuste le métabolisme du carbone, la régulation cellulaire, la croissance et la résistance au stress

Les cellules équilibrent la glycolyse avec la respiration pour soutenir leurs besoins métaboliques dans différents contextes environnementaux ou physiologiques. Avec un glucose abondant, de nombreuses cellules préfèrent se développer par glycolyse aérobie ou fermentation. À l'aide de 161 isolats naturels de levure de fission, nous avons étudié la base génétique et les effets phénotypiques de l'équilibre fermentation-respiration. Le laboratoire et quelques autres souches dépendaient davantage de la respiration. Ce trait était associé à un polymorphisme nucléotidique unique dans une région conservée de Pyk1, la seule pyruvate kinase chez la levure à fission. Cette variante a réduit l'activité Pyk1 et le flux glycolytique. Remplacement du « faible activité » pyk1 allèle dans la souche de laboratoire avec l'allèle « haute activité » était suffisant pour augmenter la fermentation et diminuer la respiration. Ce rééquilibrage métabolique a déclenché des ajustements au niveau des systèmes dans le transcriptome et le protéome et dans les traits cellulaires, notamment une croissance et une durée de vie chronologiques accrues, mais une résistance réduite au stress oxydatif. Ainsi, une faible activité Pyk1 ne conduit pas à un avantage de croissance mais à une tolérance au stress. Le réglage génétique du flux glycolytique peut refléter un compromis adaptatif chez une espèce dépourvue d'isoformes de pyruvate kinase.

Synopsis

Cette étude montre qu'un polymorphisme d'un seul nucléotide dans le seul gène de la pyruvate kinase dans Schizosaccharomyces pombe peut expliquer l'équilibre entre respiration et fermentation, conduisant à des ajustements métaboliques, régulateurs et physiologiques importants.


Prédictions TFBS pour la levure et la pombe ? - La biologie

NuPoP : Nucléosomes positionnement Prédiction

Auteurs: Ji-Ping Wang, Liqun Xi et Oscar Zarate

Références pour les méthodes:

  1. Wang, J.-P., Fondufe-Mittendorf, Y., Xi, L., Tsai, G.-F., Segal, E. et Widom, J. (2008). Linker quantifié préférentiellement longueurs en Saccharomyces cerevisiae. Biologie computationnelle PLoS, 4(9):e1000175.
  2. Xi, L., Fondufe-Mittendorf, Y., Xia, L., Flatow, J., Widom, J. et Wang, J.-P. (2010). Prédiction du positionnement des nucléosomes à l'aide d'un modèle markov caché de durée. BMC Bioinformatique, pages doi:10.1186/1471--2105--11--346.
  3. Xi, L., Brogaard, K., Zhang, Q., Lindsay, B.G., Widom et Wang, J.-P., Un modèle de cluster localement alambiqué pour les signaux de positionnement des nucléosomes dans la carte chimique, Journal de l'Association statistique américaine, 2013, 109(505) 48-62

Références des données cartographiques chimiques utilisées:

  1. Brogaard, K., Xi, L., Wang, J.-P. et Widom, J. (2012), Une carte de résolution de paires de bases des positions des nucléosomes chez la levure, La nature, 2012, 486: 496–501
  2. Moyle-Heyrman, G., Zaichuk, T., Xi, L., Zhang, Q., Uhlenbeck, OC, Holmgren, R., Widom, J. et Wang, J.-P., Chemical map of Schizosaccharomyces pombe révèle caractéristiques spécifiques à l'espèce dans le positionnement des nucléosomes, PNAS , 2013,110(50),20158-20163
  3. Voong, L.N, Xi, L., Sebeson, A.C., Xiong, B., Wang, J.-P., Wang, X. Insights into Nucleosome Organization in Mouse Embryonic Stem Cells through Chemical Mapping , Cellule, 2016, 167(6),1555-1570.e15

NuPoP V2 a ajouté une fonction predNuPoP_chem pour la prédiction des nucléosomes à l'aide de profils formés sur la base de cartes chimiques de nucléosomes pour la levure, la pombe, la souris et l'homme (les profils pour d'autres espèces sont extrapolés sur la base du profil de levure). Pour montrer une nette amélioration, la figure suivante compare la prédiction basée sur le profil MNase par rapport au profil chimique pour la levure où la courbe rouge superposée est l'occupation de la carte chimique pour les données de levure.

NuPoP est un package R pour Nucléosome positionnement Prédiction. NuPoP est construit sur un modèle de Markov caché de durée, dans lequel la longueur de l'ADN du lieur est explicitement modélisée. Le modèle d'état du nucléosome ou de l'ADN de liaison peut être choisi comme chaîne de Markov du quatrième ordre ou du premier ordre. NuPoP produit la prédiction de Viterbi de la carte de position optimale des nucléosomes, du score d'occupation des nucléosomes (à partir d'algorithmes ascendants et descendants) et du score d'affinité des nucléosomes.

En plus du package R, nous avons également développé un programme Fortran autonome disponible sur https://github.com/jipingw/NuPoP_Fortran. NuPoP Le package R et le programme Fortran peuvent prédire le positionnement des nucléosomes pour une séquence d'ADN de n'importe quelle longueur.

NuPoP ne dépend d'aucun autre package R. Il a quatre fonctions principales, predNuPoP, predNuPoP_chem, lireNuPoP, et plotNuPoP. Les predNuPoP la fonction prédit le positionnement et l'occupation des nucléosomes à l'aide de profils de nucléosomes entraînés par les données de la MNase tout en predNuPoP_chem prédit à l'aide de profils formés sur la base de cartes chimiques. les lireNuPoP la fonction lit les résultats de la prédiction, et la fonction plotNuPoP visualise les prédictions.

Les predNuPoP et predNuPoP_chem appelez une sous-routine Fortran pour traiter la séquence d'ADN et faire des prédictions, et affiche les prédictions dans un fichier texte dans le répertoire de travail actuel. Cette méthode est basée sur un modèle de Markov caché de durée composé de deux états, l'un pour le nucléosome et l'autre pour l'état de liaison. Pour chaque état, une chaîne de Markov de premier ordre et une chaîne de Markov de quatrième ordre sont intégrées. Par exemple, un échantillon de séquence d'ADN est test.seq situé dans le sous-répertoire inst/extdata du package. Appelez la fonction predNuPoP comme suit :

Notez que le fichier d'arguments doit être spécifié comme chemin complet et nom de fichier de la séquence d'ADN au format FASTA dans n'importe quel répertoire. Par exemple, si le fichier "test.seq" se trouve dans /Users/jon/DNA , la fonction peut être appelée par

ou pour la prédiction de carte chimique :

L'utilisateur ne doit pas utiliser file="

/DNA/test.seq" pour spécifier le chemin afin d'éviter les messages d'erreur. L'argument espèce peut être spécifié comme suit : 1 = Humain 2 = Souris 3 = Rat 4 = Poisson zèbre 5 = D. melanogaster 6 = C. elegans 7 = S . cerevisiae 8 = C. albicans 9 = S. pombe 10 = A. thaliana 11 = Maïs 0 = autre. Si espèce = 0 est spécifié, l'algorithme identifiera une espèce de 1 à 11 qui a la composition de base la plus similaire à l'entrée séquence, et utilisez les modèles de l'espèce sélectionnée pour la prédiction.La valeur par défaut est 7. Le modèle d'argument peut être 1 ou 4, représentant l'ordre des modèles de chaîne de Markov utilisés pour les états du nucléosome et du lieur.

Pour predNuPoP_chem , seules les espèces 1 (humain), 2 (souris), 7 (levure), 9 (S.pombe) utilisent des profils réels formés à partir de cartographies chimiques des espèces correspondantes. Pour les autres espèces, aucune donnée cartographique chimique n'est disponible. Des profils extrapolés basés sur des données de levure avec ajustement pour la composition de base sont utilisés.

Le fichier de sortie, généré dans le répertoire de travail actuel, sera nommé d'après le nom du fichier de séquence, avec une extension ajoutée comme _Prediction1.txt ou _Prediction4.txt . Pour les codes ci-dessus, le fichier de sortie sera test.seq_Prediction4.txt . Notez que predNuPoP_chem et predNuPoP ne distinguent pas les noms de sortie. Les cinq colonnes du fichier de sortie sont

  1. Position : position dans la séquence d'ADN d'entrée.
  2. P-start : probabilité que la position actuelle soit le début d'un nucléosome.
  3. Occup : score d'occupation des nucléosomes. Le score d'occupation du nucléosome est défini comme la probabilité que la position donnée soit couverte par un nucléosome.
  4. N/L : 1 indique que la position donnée est couverte par le nucléosome et 0 pour le lieur basé sur la prédiction de Viterbi.
  5. Affinité : score d'affinité de liaison aux nucléosomes. Ce score d'affinité est défini pour chaque 147 pb de séquence d'ADN centrée à la position donnée. Par conséquent, pour la première et la dernière 73 pb de la séquence d'ADN, le score d'affinité n'est pas défini (indiqué par NA).

Le fichier de sortie peut être importé dans R par la fonction readNuPoP :

La séquence génomique peut être extrêmement longue. L'utilisateur peut importer une partie des prédictions en spécifiant la position de départ startPos et la position de fin endPos dans la fonction readNuPoP. Par exemple, pour visualiser les résultats de prédiction de startPos=1 à endPos=5000 ,


Remerciements

Cette étude a été soutenue par l'Université nationale Cheng Kung et le ministère des Sciences et de la Technologie de Taïwan MOST-103-2221-E-006-174-MY2.

Cet article a été publié dans le cadre de Systèmes BMC Biologie Volume 8 Supplément 5, 2014 : Actes de la 25e Conférence internationale sur l'informatique du génome (GIW/ISCB-Asie) : Biologie des systèmes. Le contenu complet du supplément est disponible en ligne à l'adresse http://www.biomedcentral.com/bmcsystbiol/supplements/8/S5.


L'exploration de données massives alimente la recherche fongique : les avancées récentes dans les approches de biologie des systèmes de levure à fission

La recherche en biologie est entrée dans l'ère des mégadonnées. Les approches de biologie des systèmes deviennent donc des outils puissants pour obtenir l'ensemble du paysage de la séparation, de la croissance et de la résistance des cellules aux stress. Levure de fission Schizosaccharomyces pombe est un merveilleux modèle eucaryote unicellulaire, en particulier l'étude de sa division et de son métabolisme peut faciliter la compréhension du mécanisme moléculaire du cancer et la découverte d'agents anticancéreux. Dans cette perspective, nous discutons des récents outils avancés de biologie des systèmes de levure à fission, principalement axés sur le profilage métabolomique et la modélisation métabolique, l'interactome protéine-protéine et le réseau d'interaction génétique, le séquençage et les applications de l'ADN et le criblage phénotypique à haut débit. Nous espérons donc que cette revue pourra être utile aux chercheurs fongiques intéressés ainsi qu'aux bioformaticiens.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.