Informatie

9: Genomen, genen en regelgevende netwerken - Biologie

9: Genomen, genen en regelgevende netwerken - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Op dit punt hebben we genen, DNA en eiwitten geïntroduceerd, maar we hebben een aantal belangrijke vragen onopgelost gelaten. De sleutel is om kalm te blijven en te analyseren!


Genregulerende netwerken

Eric H. Davidson, in The Regulatory Genome, 2006

Uitgeversoverzicht

Dit hoofdstuk richt zich op de evolutionaire implicaties van de structuur en functie van genregulerende netwerken. Veranderingen in bepaalde functionele koppelingen van genregulerende netwerken vinden plaats op DNA-niveau door wijziging van de cis-regulerende sequentie die transcriptiefactor-doelplaatsen definieert. Differentiatiegenen zijn uniek gepositioneerd in de regulerende netwerkstructuur en bevinden zich aan de periferie van het netwerk. In tegenstelling tot alle genen die de interne structuur van het netwerk vormen, hebben hun producten niet de functie om andere genen te controleren. De beperkingen op evolutionaire verandering in de differentiatie-genbatterijfunctie zijn direct onderhevig aan selectie, omdat ze in detail de meeste fenotypische functionaliteiten produceren waarmee het dier zijn omgeving confronteert. Het lichaamsplan is gecodeerd in de interne regio's van het genregulerende netwerk, die tijdens de ontwikkeling de progressie van ruimtelijke regulatoire toestanden bepalen, niet de activiteit van differentiatie-genbatterijen. Veel van de grove regionale effecten van mutaties in het hox-gen of functieverlies op de morfologie die de afgelopen decennia zijn geregistreerd, doen denken aan evolutionaire diversificatie.


Gerelateerde Links

Referenties: Een vergelijkende encyclopedie van DNA-elementen in het muizengenoom. Yue F, Cheng Y, Breschi A, Vierstra J, Wu W, Ryba T, Sandstrom R, Ma Z, Davis C, Pope BD, Shen Y, Pervouchine DD, Djebali S, Thurman RE, Kaul R, Rynes E, Kirilusha A , Marinov GK, Williams BA, Forel D, Amrhein H, Fisher-Aylor K, Antoshechkin I, DeSalvo G, Zie LH, Fastuca M, Drenkow J, Zaleski C, Dobin A, Prieto P, Lagarde J, Bussotti G, Tanzer A , Denas O, Li K, Bender MA, Zhang M, Byron R, Groudine MT, McCleary D, Pham L, Ye Z, Kuan S, Edsall L, Wu YC, Rasmussen MD, Bansal MS, Kellis M, Keller CA, Morrissey CS, Mishra T, Jain D, Dogan N, Harris RS, Cayting P, Kawli T, Boyle AP, Euskirchen G, Kundaje A, Lin S, Lin Y, Jansen C, Malladi VS, Cline MS, Erickson DT, Kirkup VM, Leerde K, Sloan CA, Rosenbloom KR, Lacerda de Sousa B, Beal K, Pignatelli M, Flicek P, Lian J, Kahveci T, Lee D, Kent WJ, Ramalho Santos M, Herrero J, Notredame C, Johnson A, Vong S , Lee K, Bates D, Neri F, Diegel M, Canfield T, Sabo PJ, Wilken MS, Reh TA, Giste E, Shafer A, Kutyavin T, Haugen E, Dunn D, Reynolds AP, N eph S, Humbert R, Hansen RS, De Bruijn M, Selleri L, Rudensky A, Josefowicz S, Samstein R, Eichler EE, Orkin SH, Levasseur D, Papayannopoulou T, Chang KH, Skoultchi A, Gosh S, Disteche C, Treuting P, Wang Y, Weiss MJ, Blobel GA, Cao X, Zhong S, Wang T, Goede PJ, Lowdon RF, Adams LB, Zhou XQ, Pazin MJ, Feingold EA, Wold B, Taylor J, Mortazavi A, Weissman SM, Stamatoyannopoulos JA, Snyder MP, Guigo R, Gingeras TR, Gilbert DM, Hardison RC, Beer MA, Ren B Mouse ENCODE Consortium. Natuur. 2014 november 20515(7527):355-64. doi: 10.1038/natuur13992. PMID: 25409824.

Behoud van trans-acting circuits tijdens de evolutie van de regulering van zoogdieren. Stergachis AB, Neph S, Sandstrom R, Haugen E, Reynolds AP, Zhang M, Byron R, Canfield T, Stelhing-Sun S, Lee K, Thurman RE, Vong S, Bates D, Neri F, Diegel M, Giste E, Dunn D, Vierstra J, Hansen RS, Johnson AK, Sabo PJ, Wilken MS, Reh TA, Treuting PM, Kaul R, Groudine M, Bender MA, Borenstein E, Stamatoyannopoulos JA. Natuur. 2014 november 20515 (7527): 365-70. doi: 10.1038/natuur13972. PMID: 25409825.

Principes van het behoud van regelgevende informatie tussen muis en mens. Cheng Y, Ma Z, Kim BH, Wu W, Cayting P, Boyle AP, Sundaram V, Xing X, Dogan N, Li J, Euskirchen G, Lin S, Lin Y, Visel A, Kawli T, Yang X, Patacsil D , Keller CA, Giardine B Mouse ENCODE Consortium, Kundaje A, Wang T, Pennacchio LA, Weng Z, Hardison RC, Snyder MP. Natuur. 2014 november 20515(7527):371-5. doi: 10.1038/natuur13985. PMID: 25409826.

Topologisch associërende domeinen zijn stabiele eenheden van replicatie-timing-regulatie. Pope BD, Ryba T, Dileep V, Yue F, Wu W, Denas O, Vera DL, Wang Y, Hansen RS, Canfield TK, Thurman RE, Cheng Y, Gülsoy G, Dennis JH, Snyder MP, Stamatoyannopoulos JA, Taylor J , Hardison RC, Kahveci T, Ren B, Gilbert DM. Natuur. 2014 november 20515(7527):402-5. doi: 10.1038/natuur13986. PMID: 25409831.

Muisregulerende DNA-landschappen onthullen wereldwijde principes van cis-regulerende evolutie. Vierstra J, Rynes E, Sandstrom R, Zhang M, Canfield T, Hansen RS, Stehling-Sun S, Sabo PJ, Byron R, Humbert R, Thurman RE, Johnson AK, Vong S, Lee K, Bates D, Neri F, Diegel M, Giste E, Haugen E, Dunn D, Wilken MS, Josefowicz S, Samstein R, Chang KH, Eichler EE, De Bruijn M, Reh TA, Skoultchi A, Rudensky A, Orkin SH, cPapayannopoulou T, Treuting PM, Selleri L, Kaul R, Groudine M, Bender MA, Stamatoyannopoulos JA. Wetenschap. 2014 november 21346(6212):1007-12. doi: 10.1126/wetenschap.1246426. PMID: 25411453.

Vergelijking van de transcriptionele landschappen tussen menselijke en muisweefsels. Lin S, Lin Y, Nery JR, Urich MA, Breschi A, Davis CA, Dobin A, Zaleski C, Beer MA, Chapman WC, Gingeras TR, Ecker JR, Snyder MP. Proc Natl Acad Science V.S. 2014 december 2111(48):17224-9. doi: 10.1073/pnas.1413624111. Epub 2014 20 november. PMID: 25413365.

Financiering: NIH's National Human Genome Research Institute (NHGRI), National Institute of General Medical Sciences (NIGMS), National Cancer Institute (NCI), National Institute of Diabetes and Digestive and Kidney Diseases (NIDDK), Eunice Kennedy Shriver National Institute of Child Health and Human Ontwikkeling (NICHD), National Heart, Lung, and Blood Institute (NHLBI), National Institute of Environmental Health Sciences (NIEHS), National Institute on Drug Abuse (NIDA), National Institute of Mental Health (NIMH), National Institute of Neurological Disorders and Stroke (NINDS), en NIH Common Fund Spanish Plan Nacional Wellcome Trust Howard Hughes Medical Institute National Science Foundation en de American Recovery and Reinvestment Act.


Resultaten

Oxidatie- en antioxidantevaluatie van de drie hooglandkatoentoevoegingen CRI12, LAT40 en MAR85 onder zoutstressomstandigheden

De drie genotypen van hooglandkatoen zijn morfologisch identiek en vertonen geen significante variaties bij blootstelling aan enige vorm van stress, dus er werd in dit onderzoek geen rekening gehouden met verschillende morfologische kenmerken. We hebben echter variatie waargenomen in wortelgroei en biomassa-accumulatie, CRI12 en LAT40 hadden een relatief hogere wortel en over het algemeen hogere biomassa in vergelijking met MAR85 (Fig. 1a). Bovendien vertoonden MAR85 en CRI12 bij het uitvoeren van een diepgaande analyse van de concentratieniveaus van oxidant- en antioxidantenzymen op de bladweefsels van de drie cultivars onder zoutstressomstandigheden significant hogere concentraties van proline en superoxide dismutase (SOD) vergeleken met LAT40 (Fig. 1b), een indicatie dat CRI12 en MAR85 minder werden beïnvloed onder zoutstress in vergelijking met LAT40. Bovendien is de concentratie van malondialdehyde (MDA) in de planten een indicatie dat de planten lijden aan oxidatieve stress, aangezien MDA een bijproduct is van lipideperoxidatie [22]. De verkregen resultaten waren in overeenstemming met eerdere bevindingen waarin de knockdown van de trihelix-transcriptiefactor in katoen de tolerantie voor droogte en zoutstress verminderde en op zijn beurt de accumulatie van verschillende oxidanten en MDA-niveaus onder blootstelling aan droogte en zoutstress versnelde [22].

Morfologische en fysiologische kenmerken van MAR85, CRI12 en LAT40 na behandeling met zout-alkalistress. een Zaailing fenotype in verschillende stadia van ontwikkeling in drie toevoegingen van hooglandkatoen. B Het dynamische PRO-, MDA- en SOD-gehalte na behandeling met zout-alkalistress

Sequentie- en transcriptidentificatie

De transcriptie-analyses van drie aanwinsten van G. hirsutum verschilden significant in hun morfologische kenmerken, evenals hun cruciale inzichten op systeemniveau in moleculaire mechanismen die ten grondslag liggen aan de alkali-zoutstressrespons [23, 24]. In deze studie werd een hooggelegen katoencultivar (CRI12, China) en twee andere wilde hooggelegen katoencultivar (LAT40, G. hirsutum ras latifolium40 en MAR85, G. hirsutum race mari-garant85) werden gebruikt voor transcriptie-analyse door RNA-sequencing uit te voeren op hun weefsels wanneer ze werden blootgesteld aan stress door zoutgehalte. Twee organen werden beschouwd, het blad en de wortel van de drie toetredingen, bij vier verschillende behandelingsstadia werden de monsters gecodeerd als Rt_0h, Rt_3h, Rt_12h, Rt_48h voor de wortelmonsters en bladmonsters werden gecodeerd als Lf_0h, Lf_3h, Lf_12h en Lf_48h, alle de monsters werden drie keer gerepliceerd. De prestaties van de drie hooggelegen katoenaanwinsten werden gecategoriseerd in vier verschillende groepen, zoals normaal groeistadium (CK0), vroeg alkali-zout stressreactiestadium (SS3), zaailingen aanzienlijk beschadigd stadium (SS12) en zaailing hersteld stadium (SS48). Om de transcriptoomdynamiek tijdens de behandeling met alkali-zoutstress te onderzoeken, werd totaal RNA geïsoleerd uit het blad en de wortel van drie toevoegingen van G. hirsutum in vier verschillende behandelingsfasen. In totaal werden 1.106.485.712 nummers van de onbewerkte uitlezingen geproduceerd uit 48 cDNA-bibliotheken, na reiniging werden 1.097.617.134 (99,19%) schone uitlezingen verkregen. Het percentage toegewezen leesbewerkingen onder schone leesbewerkingen in elke bibliotheek varieerde van 83,88 tot 89,61%, bovendien varieerde het percentage schone leesbewerkingen met een Phred-kwaliteitswaarde van 30% van 94,37 tot 97,05%. Bovendien werden de schone uitlezingen uitgelijnd met het referentiegenoom van Gossypium hirsutum (ADVERTENTIE1), waarin 83,06 tot 89,73% uitlezingen gegenereerd uit de 48 monsters werden toegewezen aan het referentiegenoom, waardoor 77,4-82,3% van de uniek toegewezen uitlezingen naar het referentiegenoom werden geproduceerd. G. hirsutum genoom. Wat interessanter was, waren de uniek in kaart gebrachte uitlezingen die werden toegewezen aan het referentiegenoom met behulp van HT-seq (Python-pakket), met een hogere efficiëntie en nauwkeurigheid (tabel 1 en https://www.ncbi.nlm.nih.gov/sra/ PRJNA531727).

Transcriptie- en expressieanalyse in verschillende weefsels van de drie katoensoorten onder zoutstress

In totaal werden 64.737 genen geïdentificeerd en het aantal tot expressie gebrachte genen in verschillende monsters varieerde van 51.586 tot 57.263 zoals gedetecteerd door RNA-sequentiegegevensanalyse (Fig. 2a). Om de globale verschillen in de transcriptoomdynamiek tijdens ongelijke behandelingsstadia te begrijpen, zijn de expressieverdelingsanalyse, correlatieanalyse, hoofdcomponentenanalyse (PCA) en hiërarchische clustering realistisch bereikt op basis van FPKM-waarden voor alle tot expressie gebrachte genen in ten minste één van de 32 weefselmonsters (Fig. 2b). De bladmonsters vertoonden een lager expressieniveau dan wortel, en hetzelfde behandelingsweefsel/behandelingsstadium van drie toevoegingen van G. hirsutum toonde de vergelijkbare expressieverdeling. De Pearson-correlatiecoëfficiëntanalyse, onder de gecombineerde 32 monsters, illustreerde een significantere correlatie in hetzelfde weefsel/behandelingsstadium tussen drie toetredingen van G. hirsutum (Fig. 2c). Zoals verwacht, clusterden bladtranscriptoom van drie contrasterende hooglandkatoenrassen samen en vertoonden aanzienlijke verschillen met behandelingspunten. De LAT40 en CRI12 vertoonden een meer exacte correlatie en vergelijkbaar fenotype in het blad na behandeling met alkalizout duidde op een hoge overeenkomst in hun transcriptieprogramma's. Vergeleken met CK0-stadia demonstreerden SS3, SS12 en SS48 dichter in de wortel en het blad van drie toevoegingen van hooglandkatoen (figuur 2d). Het suggereerde een significant verschil in transcriptieprogramma's tussen de standaard- en alkali-zoutstressconditie. Over het algemeen vertoonden weefsels/behandelingsstadia een hogere correlatie in deze analyses die naar verwachting meer vergelijkbare transcriptomen en functies/activiteiten zouden hebben.

Genexpressieanalyse van drie toevoegingen van G. hirsutum. een expressieniveauverdeling van verschillende samples B Heatmap van monstercorrelatieanalyseresultaatbasis op globale transcriptoomexpressie onder alkali-zoutstress C Plot van Principal Component Analysis (PCA) basis op globale transcriptoomexpressie onder alkali-zoutstress NS Clustering van monsters op basis van globale transcriptoomexpressie onder alkali-zoutstress

Differentiële genexpressie na alkali-zoutbehandeling

Om het differentiële expressiepatroon van de verschillende transcriptionele factoren in de drie hooggelegen katoenaanwinsten te onderzoeken, werden twee weefsels geprofileerd, de blad- en wortelweefsels onder zoutstress. Het totale aantal differentieel tot expressie gebrachte genen (DEG's) varieerde, variërend van 8663 (MAR85L_CK0 vs. MAR85L_SS12) tot 22.068 (CRI12R_CK0 vs. CRI12R_SS12) bovendien werden de DEG's verkregen uit paarsgewijze vergelijking (MAR85L: MAR85L_CK0 vs.85 MAR85L_SS3 MAR85L_CK0 vs. MAR85L_SS48 MAR85R, LAT40L/R en CRI12L/R paarsgewijze vergelijking was vergelijkbaar met MAR85L) met behulp van DEGseq-software (Fig. 3a). Een groter aantal DEG's waargenomen in wortels (in totaal 41.132 °C) dan in bladeren (in totaal 35.724 °C), wat erop wijst dat de wortels het belangrijkste weefsel kunnen zijn dat wordt aangetast door zoutstress en dus een meer dynamische en complexe genregulatie hebben om de toxiciteit van zouten voor de wortelcellen te verminderen. De verkregen resultaten zijn in overeenstemming met eerdere bevindingen in genexpressiepatroon neigt weefselspecifiek te zijn Magwanga et al. [25], vond dat een hoog aantal van de LEA genen waren sterk opgereguleerd in de bladweefsels in vergelijking met stengel- en wortelweefsels onder droogtestress. Vergeleken met SS3 (respectievelijk 21.738 en 30.525 in bladeren en wortels) en SS48 (23.418 en 26.533, respectievelijk in bladeren en wortels) stadia, vertoonde het SS12-stadium (28.521 en 32.560, respectievelijk in bladeren en wortels) het hoogste aantal van DEG's in wortel en blad, wat aangeeft dat het SS12-stadium meer geactiveerd was voor reactie op alkali-zoutstress. Interessant is dat MAR85 het laagste aantal DEG's in alle stadia liet zien in vergelijking met LAT40 (hoogste aantal DEG's) en CRI12. Het gaf aan dat de inconsistente reacties op alkali-zoutstress van drie toetredingen van hooglandkatoen. Bovendien werden 3509 (SS3 VS. CK0) 8138 (SS12 VS. CK0) en 5955 (SS48 VS. CK0) gewone DEG's geïdentificeerd in elk stadium, gevolgd door alkalizoutbehandeling in de bladeren van drie toevoegingen van hooglandkatoen. Vervolgens werden 8870 (SS3 VS. CK0), (Fig. 3e), 10.428 (SS12 VS. CK0) en 7281 (SS48 VS. CK0), DEG's geïdentificeerd in de wortels (Fig. 3b). Het variabele aantal differentieel tot expressie gebrachte genen suggereerde dat elk weefsel/alkalizoutbehandelingsstadium zijn eigen onafhankelijke ontwikkelingsprogramma's behield. Als alternatief kan de transcriptionele complexiteit alleen de complexiteit van de gevangen zaadstadia weerspiegelen, die meer dan één celtype bevatten.

Verschillende expressiegenen (DEG's) analyse van drie toevoegingen van G. hirsutum. een DEGs-nummer na alkali-zoutbehandeling B-G DEG's in verschillende behandelingsstadia in blad en wortel (respectievelijk L3 h, L12 h, L48 h, R3h, R12h en R48h)

Functionele annotatie van DEG-sets in de drie toetredingen van hooglandkatoen op verschillende weefsels (blad en wortel)

Een totaal van 22.359°C (respectievelijk 11.818 en 15.674 in blad en wortel) werd gebruikt voor functionele verrijking en gewogen co-expressienetwerkanalyse (WGCNA). De clusteranalyse, het gevolg van de 27.492 DEG's, was vergelijkbaar met de clusteranalyse van alle genen. Deze empirische waarneming ondersteunde de 22.359°C, zoals verkregen uit de blad- en wortelweefsels in de drie verschillende katoenaanwinsten, die de variaties in de geanalyseerde monsters nauwkeurig konden illustreren. De gemeenschappelijke DEG's van elk weefsel / stadium in drie toevoegingen van hooglandkatoen werden verder gebruikt voor het uitvoeren van de genontologie (GO) verrijking en Kyoto encyclopedie van genen en genomen (KEGG) verrijkingsanalyse. In totaal werden 17.985 genen geannoteerd, waarbij 7836 en 10.149 differentieel tot expressie werden gebracht in respectievelijk het blad en de wortels. Van de 7836 geannoteerde DEG's waren 105 GO-termen aanzienlijk verrijkt op P-waarde ≤0,05, FDR ≤ 0,05 (Aanvullend bestand 6: Tabel S2). In de wortels waren meer van de DEG's geannoteerd, maar slechts 96 GO-termen bleken significant verrijkt te zijn (aanvullend bestand 7: tabel S3). Bovendien werden 54 GO-termen vaak verrijkt tussen het blad- en wortelweefsel, waaronder oxidatiereductieproces (GO: 0055114), koolhydraatmetabolisme (GO: 0005975), oxidoreductase-activiteit (GO: 0016491), eiwitserine/threoninekinase-activiteit ( GO: 0004713) en transcriptiefactoractiviteit (GO: 0003700), waarvan bekend was dat ze betrokken waren bij een abiotische stressrespons.

Weefselspecifieke GO-termen voor verrijking werden waargenomen waarbij de DEG's die uit het blad werden verkregen significant waren verrijkt in fotosynthese (GO: 0015979) en fotosynthese-gerelateerde GO-termen (GO: 0019684, GO: 0009765). Bovendien werden alle 4163 DEG's (respectievelijk 2426 en 2667 DEG's in bladeren en wortels) verrijkt met behulp van de KEGG-database. De DEG's van het blad en de wortel waren significant verrijkt in respectievelijk 30 en 34 KEGG-termen, met de Q-waarde van ≤0.0001en gennummer voor elke geanalyseerde term ingesteld op ≥3 (aanvullend bestand 8: tabel S4 en aanvullend bestand 9: tabel S5). Signaaltransductie van plantenhormoon (ko04075) en de biosynthese van secundaire metabolieten (ko01110) waren de meest voorkomende gedetecteerde KEGG-routes (aanvullend bestand 2: figuur S1 en S2), en eerder is gevonden dat de twee routes significant betrokken zijn bij abiotische stressrespons [26,27,28,29].Bovendien waren de gedetecteerde bladspecifiek verrijkte KEGG-termen die gerelateerd aan het fotosyntheseapparaat van het plantenblad, zoals fotosynthese (ko00195) en fotosynthese - antenne-eiwitten (ko00196). Hoewel de alkali-zoutstressrespons betrokken is bij complexere routes, signaaltransductie- en oxidatiereductieprocessen, kunnen de gedetecteerde DEGS een kernrol spelen in de blad- en wortelweefsels van katoen onder zoutstressomstandigheden. Afgezien van de DEG's, analyseerden we de verschillende transcriptiefactoren van planten met een vermeende functie bij het verbeteren van de zoutstresstolerantie tussen de drie gebruikte katoencultivars. In totaal werden 2080 TF's geïdentificeerd, waarbij 991 TF's werden gedetecteerd onder de DEG's in de bladweefsels, terwijl 1577 TF's afkomstig waren van de DEG's die werden geanalyseerd uit de wortels van wortelweefsel (aanvullend bestand 10: tabel S6). De resultaten die voor de TF's werden verkregen, correleerden positief met de verdeling van de DEG's waarin er meer tot expressie werden gebracht in de wortels dan in de bladweefsels, een indicatie dat de wortels het primaire plantenweefsel zouden kunnen zijn, dat sterk wordt aangetast onder zout stress omstandigheden. In alle geïdentificeerde TF's bleken 53 verschillende genfamilies te zijn gekoppeld aan de TF's, zoals ZF-HD, SRS, S1Fa-achtige, SAP en NF-X1 TF-families werden geïdentificeerd voor de DEG's voor de wortelweefsels, terwijl de YABBY TF-familie , werd gedetecteerd voor de DEG's die werden gevonden voor de bladweefsels.

Co-expressie netwerk en module constructie

Om het genregulerende netwerk van alkali-zoutstressrespons in hooggelegen katoen te onderzoeken, identificeerden we samen tot expressie gebrachte genensets via gewogen gen-co-expressienetwerkanalyse (WGCNA) die kan worden gebruikt om netwerken (modules) van sterk gecorreleerde genen te vinden [30] ]. In de huidige studie werden 22.359 DEG's gebruikt voor WGCNA. Om een ​​schaalvrij netwerk te garanderen, is de kracht van β = 12 (schaalvrij R2 = 0,8740) werd nauwkeurig geselecteerd door bepaling van het zachte drempelvermogen (aanvullend bestand 3: figuur S3A/B) en evaluatie van schaalvrije topologieanalyse (aanvullend bestand 3: figuur S3C/D). Vertegenwoordigen van interactie tussen genen met vergelijkbare expressieprofielen, werden verschillende netwerken geïdentificeerd die co-expressiemodules werden genoemd. Via de Dynamic Tree Cut-methode werden in totaal 20 modules geïdentificeerd (kernparameter: MEDissThres = 0.25), variërend van 135 genen in de mistyrose-module tot 4793 genen in de donkermagenta-module. Van de 20 modules waren 17 genen niet bruikbaar, die in de grijze module werden weergegeven en niet door andere modules konden worden geselecteerd (aanvullend bestand 4: Fig. 4a-b). Duizend genen werden willekeurig geselecteerd voor visualisatie van genennetwerken. Genen in dezelfde module vertoonden een hogere topologische overlap (aanvullend bestand 4: figuur S4), wat aangeeft dat netwerken (modules) die zijn geconstrueerd door WGCNA biologische nuttige functies hebben.

Co-expressie netwerk constructie van drie toetredingen van hooggelegen katoen. een Clustering dendrogram van 22.359 verschillende tot expressie gebrachte genen, met ongelijkheid op basis van topologische overlap. De kleurrijen bieden een eenvoudige visuele vergelijking van moduletoewijzingen (takknipsels) op basis van de dynamische hybride takknipmethode. B Gennummer van elke netwerken/modules

Identificatie en visualisatie van weefsel-/stadiumspecifieke modules in blad en wortel van hooglandkatoen

Een samenvattend profiel (eigengene) voor elke module verkregen door WGCNA. Bijvoorbeeld, clustering van warmtekaart en eigengenbalkplot van modules die sterk correleerden met eigenschappen, die werden getoond in (Fig. 5a), het vertegenwoordigde de genexpressieniveaus van elke module. Om de correlatie tussen module en eigenschap te bepalen, associeerden we eigengenen met respectievelijk alkali-zoutbehandelingsstadia en hooglandkatoenrassen via Pearson-correlatiecoëfficiëntanalyse. Interessant is dat geen van de modules significant geassocieerd is met drie hooggelegen katoenrassen (r ≥ 0,60, p ≤ 0,01) 11 co-expressiemodules vertoonden echter een relatief hogere correlatie (r ≥ 0,60) met SS3, SS12, SS48 stadia in blad en wortel van hooglandkatoen (Fig. 5b-c). Het suggereerde dat de co-expressienetwerken significant verschillend waren in verschillende stadia. Integendeel, geen van de co-expressienetwerken bleek geassocieerd te zijn met drie toevoegingen van hooglandkatoen, wat aangeeft dat een bepaald regulerend netwerk van alkali-zoutstressrespons in verschillende hooggelegen katoenrassen. SS12- en SS48-stadia waren gecorreleerd met meer dan één module. SS12-stadium was gecorreleerd met de bruine 2 (gennummer: 1163, r = 0,79), donker olijfgroen (Gennummer: 416, r = 0,76) en donker zeegroen 4 (Gennummer: 237, r = 0,68) modules in blad, en gecorreleerd met middelgrote orchidee (gennummer: 241, r = 0,66) en blauwviolet (Gennummer: 2632, r = 0,71) modules in de root, respectievelijk. SS48-stadium werd geassocieerd met mistige roos (gennummer: 135, r = 0,67) en licht leiblauw (Gennummer: 1300, r = 0,87) modules in blad, en geassocieerd met licht staalblauw1 (Gennummer: 1218, 0,87) en oranjerood 4 (Gennummer: 536, r = 0,85) modules in de root, respectievelijk. Terwijl slechts één module gecorreleerd was met SS3-stadium (navajo wit (gennummer: 326, r = 0,88) moduleSS3 trap in blad oranje rood1 (Gennummer: 1836, r = 0,95) module-SS3-trap in root). Interessant genoeg waren de sterk en significant gecorreleerde modules allemaal positief gecorreleerd met verschillende stadia, wat aangaf dat verschillende expressiegenen in verschillende weefsels / stadia voornamelijk werden opgereguleerd als reactie op alkali-zoutstress.

Visualisatie van genexpressieniveaus en eigengenwaarden van significante modules. een Clustering heatmap en bar plot vertegenwoordigen genexpressie niveaus van elke module. In de heatmaps variëren de kleuren van groen tot rood, wat respectievelijk lage tot hoge expressieniveaus aangeeft. B Heatmap van correlaties tussen module en verschillende behandelingsstadia in blad en wortel. C Heatmap van correlatie tussen modules en drie toevoegingen van hooglandkatoen in blad en wortel. De kleuren variërend van blauw via wit tot rood geven respectievelijk lage tot middelmatige tot hoge correlaties aan. ME, de eerste hoofdcomponent van de gestandaardiseerde expressieprofielen van een bepaalde module

GO verrijkingsanalyse

We voerden GO-verrijkingsanalyse uit van genen in weefsel-/stadiumspecifieke modules. De verrijkte GO-termen zijn weergegeven in (Aanvullend bestand 12: Tabel S8). GO-analyse categoriseert de genen in drie mogelijke groepen, namelijk cellulaire component (CC), moleculaire functies (MF) en biologisch proces (BP). De voor de DEG's gedetecteerde moleculaire functie was signaaltransduceractiviteit (GO:0004871) en fosforelayresponsregulatoractiviteit (GO:0000156) die significant waren verrijkt in het SS3-stadium, eiwittyrosinekinase-activiteit (GO:0004713), eiwitkinase-activiteit (GO :0004672) en eiwitserine/threoninekinase-activiteit (GO:0004674) waren de top drie van sterk verrijkt in het SS12-stadium in blad, terwijl nucleïnezuurbinding in het regulerende gebied (GO:0001067), transcriptie-regulerende regio-DNA-binding (GO:0044212), regulerende regio DNA-binding (GO:0000975) waren top drie significant verrijkt in het SS48-stadium (P < 0,001, FDR < 0,05) in blad. In de GO-verrijkingsanalyse voor het biologische proces (BP) werd geen significante route geïdentificeerd in de SS3-stadia in bladeiwitfosforylering (GO:0006468), macromolecuulmodificatie (GO:0043412) en eiwitmodificatieproces (GO:0036211) waren de top drie routes in het SS12-stadium in blad, terwijl het metabolisme van één organisme (GO:0044710), koolhydraatmetabolisme (GO:005975) en oxidatie-reductieproces (GO:0055114) de top drie routes waren in het SS48-stadium in blad . Voor GO-analyse van moleculaire functie, nucleïnezuurbindende transcriptiefactoractiviteit (GO:0001071), transcriptiefactoractiviteit, sequentiespecifieke DNA-binding (GO:0003700) en oxidoreductase-activiteit die werken op gepaarde donoren, met incorporatie of reductie van moleculaire zuurstof (GO :0016705) waren de top drie die significant waren verrijkt in het SS3-stadium in de wortel. Bovendien waren UDP-N-acetylmuramaatdehydrogenase-activiteit (GO:008762), chromatinebinding (GO:0003682), macromoleculaire complexbinding (GO:0044877) de top drie van sterk verrijkte in het SS12-stadium in wortel, terwijl oxidoreductase-activiteit (GO:0016491), Acyl-CoA-dehydrogenase-activiteit (GO:0003995) en katalytische activiteit (GO:0003824) de top drie waren die significant verrijkt waren in het SS48-stadium in wortel. Interessant is dat oxidoreductase-activiteit werd gevonden in verschillende stadia van differentiatie. In de GO-verrijkingsanalyse van biologisch proces, regulatie van RNA-biosynthetisch proces (GO: 2001141), regulatie van transcriptie, DNA-matrijs (GO:006355), regulatie van nucleïnezuur-template transcriptie (GO: 1903506) waren top drie significant verrijkt GO-termen in SS3-stadium in wortelregulatie van RNA-metabolisme (GO:0051252), regulatie van RNA-biosynthetisch proces GO: 2001141 en regulatie van transcriptie, DNA-matrijs (GO:006355) waren de top drie routes in het SS12-stadium in wortel. Evenzo met het SS12-stadium in blad waren het metabolische proces van één organisme (GO: 0044710), het proces van één organisme (GO: 0044699) en het oxidatie-reductieproces (GO: 0055114) de drie belangrijkste routes in het SS48-stadium in de wortel. Over het algemeen werd signaaltransductie uitgevoerd in SS3- en SS12-stadia en werd de transcriptie gereguleerd in SS48-stadium in blad. Hoewel het ingewikkeld is om alkali-zoutstress in de wortel te reguleren, werd de oxidatie-reductie in alle stadia gereguleerd. De verkregen resultaten waren in overeenstemming met eerdere bevindingen waarin vergelijkbare GO-termen zijn geïdentificeerd voor verschillende stressgevoelige genen zoals: LEA genen [25], MAAT genen [31] onder andere.

Identificatie van centrale en sterk verbonden genen

Om hub-genen onder de zout-alkali-stress te identificeren, werden twee verschillende methoden gebruikt voor het screenen van genen. Elk gen mogelijkheid gewicht (P. gewicht) waarde werd verkregen door de netwerkscreeningfunctie van het WGCNA-pakket op basis van gen significantie (GS), modulair lidmaatschap (MM) en lager P. De gewichtswaarde gaf aan dat het gen een hogere correlatie had met eigenschappen (behandelingsstadia). De top 30 middelpunt genen werden geïdentificeerd op basis van p. Gewicht. In de tweede methode werden de top 150 en top 300 sterk verbonden genen voor hogere correlatiemodules van verschillende stadia geselecteerd voor analyse op basis van de topologische overlapmatrix (TOM) van alle differentiële expressiegenen. Bovendien werden de top 30 genen die centraal en sterk verbonden waren, gevisualiseerd met behulp van de Cytoscape 3.3.0-software (aanvullend bestand 11: tabel S7, figuur 6a-b). In totaal 180 middelpunt genen met een hogere correlatie met verschillende behandelingsstadia werden gevonden en 180 genen met een hogere connectiviteit werden ook geselecteerd in zes verschillende stadia, waarbij 39 gemeenschappelijke genen werden geïdentificeerd door twee verschillende methoden die de kernrol van deze genen aangaven als reactie op alkali-zoutstress. Interessant is dat 19 en 18 gemeenschappelijke genen werden verkregen in SS3L- en SS48L-stadia, maar geen van de gemeenschappelijke genen werd in andere stadia gevonden. Transmembraaneiwitten (Pfam: DUF3082), Gh_D11G2953 en Gh_A11G2587, waren de meest gecorreleerde genen met andere genen en in SS3L-stadia onder alkali-zoutstress. Galactosyltransferase familie eiwit (Gh_D05G1401 en Gh_A05G1229) en lysine decarboxylase familie eiwit (Gh_D05G1724 en Gh_A03G0267) werd ook een indicatie waargenomen dat deze genen significant belangrijke factoren waren in het SS3L-stadium met betrekking tot zoutstresstolerantie.

Visualisatie van verbindingen van genen in verschillende modules door heatmap en Cytoscape 3.3.0. In het bovenste deel van de A-F-afbeelding worden heatmap-plots weergegeven die de relaties weergeven tussen de 30 belangrijkste genen die zijn geïdentificeerd door netwerkscreening. Elke kolom en rij van de warmtekaart komt overeen met een enkel gen. Lichte kleuren betekenen topologische overlappingen, geleidelijk donkerdere kleuren komen overeen met hogere topologische overlappingen. In het onderste deel van het A-F-beeld, verbindingen van 30 hub-genen die werden geselecteerd uit de top 150 sterk verbonden genen en de top 300 verbindingen van sterk verbonden genen van modules met een hogere correlatie. Percelen A-F toont de middelpunt genennetwerk van respectievelijk L3 h, L12 h, L48 h, R3h, R12h en R48h

Drie verschillende zetmeelvertakkende enzymen (Gh_A02G1739, Gh_D02G0995 en Gh_Sca006745G03) en twee RING/U-box superfamilie-eiwitten (Gh_D05G0963 en Gh_D07G1649) werden geïdentificeerd die een belangrijke rol zouden kunnen spelen in SS48L-stadia. Homologe genenparen werden tegelijkertijd geïdentificeerd door WGCNA en suggereerden hun mogelijke sleutelrollen bij de regulatie van alkali-zoutstress in katoen. Er werden in totaal 35 TF's gevonden onder: middelpunt genen vertoonden van de 26 TF's een hogere connectiviteit met verschillende DEG's. Bovendien hadden van de 35 TF's 4 van de gemeenschappelijke genen een hogere correlatie met andere genen en behandelingsstadia onder alkali-zoutstress, waren leden van de dubbele B-box zinkvinger (DBB, Gh_A10G0877 en Gh_A11G2610) en nucleaire factor YA (NF-YA, Gh_D03G0606 en Gh_Sca006219G01) TF-familie. Totaal, 321 middelpunt genen werden geïdentificeerd, waaronder 35 transcriptiefactoren.

Validatie van de hub-genen door RT-qPCR

Om het expressieniveau en de functie van de middelpunt gen, werden 12 genen geselecteerd en hun expressieanalyses. In elk van de geselecteerde genen werden willekeurig vijf monsters onderzocht met RT-qPCR. De genprimer-informatie van 12 middelpunt genen is ontworpen en details zijn opgenomen in (Aanvullend bestand 5: Tabel S1, Aanvullend bestand 6: Tabel S2, Aanvullend bestand 7: Tabel S3, Aanvullend bestand 8: Tabel S4, Aanvullend bestand 9: Tabel S5, Aanvullend bestand 10: Tabel S6 , Aanvullend bestand 11: Tabel S7, Aanvullend bestand 12: Tabel S8). We ontdekten dat de gegevens op genexpressieniveau van RT-qPCR significant sterk gecorreleerd waren (cor = 0,7397, P-waarde = 1.458e-11) met de gegevens van RNA-seq (Fig. 7a). Dit resultaat bewees dat de RNA-seq-gegevens betrouwbaar waren in dit onderzoek. Bovendien werden de hub-genen, vergeleken met het expressieniveau van controlezaailingen, differentieel tot expressie gebracht onder zoutstressomstandigheden, wat suggereerde dat de door WGCNA geïdentificeerde hub-genen een vermeende rol speelden in de zout-alkalistressrespons.

Validatie van hub-genen door RT-qPCR

Verbeterde zoutgevoeligheid in GhSOS3 en GhCBL10 virus-geïnduceerde gen-uitschakeling (VIGS) zaailingen

Om de functies van hub-genen verder te onderzoeken, GhSOS3 en GhCBL10, de VIGS pYL156-GhPDS, pYL156-Ctrl, pYL156-GhSOS3 en pYL156-GhCBL10 planten werden waargenomen onder de zout-alkali-stress. Albinobladeren werden waargenomen in met pYL156-PDS geïnoculeerde zaailingen na 7 dagen inoculatie. Vergeleken met geïnfecteerde zaailingen, vonden we dat controlezaailingen een snelle groei vertoonden na 20 dagen inoculatie. Bovendien werden geen verschillen opgemerkt tussen geïnfecteerde zaailingen (Fig. 8a). De expressieniveaus van GhSOS3 en GhCBL10 werden gecontroleerd met RT-qPCR Vergeleken met pYL156-Ctrl zaailingen, expressieniveaus van GhSOS3 en GhCBL10 werden neerwaarts gereguleerd in de overeenkomstige gen-uitschakelingszaailingen na 20 dagen inoculatie (Fig. 8b). het verlof van pYL156-GhSOS3 en pYL156-GhCBL10 zaailingen verdord en verwelkt in vergelijking met de controle en de pYL156-Ctrl-zaailingen na 20 dagen zout-alkali-stressbehandeling (Fig. 8c). Bovendien was het PRO- en SOD-gehalte lager in pYL156-GhSOS3 en pYL156-GhCBL10 zaailingen vergeleken met controle- en pYL156-Ctrl-zaailingen na 20 dagen zout-alkalistressbehandeling. Integendeel, het MDA-gehalte was hoger in pYL156-GhSOS3 en pYL156-GhCBL10 zaailingen vergeleken met controle- en pYL156-Ctrl-zaailingen (Fig. 8d). Dit resultaat suggereerde pYL156-GhSOS3 en pYL156-GhCBL10 de gevoeligheid van de zaailingen was verbeterd.

Fenotype-evaluatie, expressie-analyse en biochemische testen op de VIGS en wildtype planten onder alkali-zoutstress. een Het fenotype van normaal (CK), pYL156-Ctrl, pYL156-PDS, pYL156-GhSOS3 en pYL156-GhCBL10 zaailingen van MAR85. B Het fenotype van normaal (CK), pYL156-Ctrl, pYL156-PDS, pYL156-GhSOS3 en pYL156-GhCBL10 zaailingen van MAR85 na 20 dagen na behandeling met zout-alkalistress. C Het expressieniveau van GhCBL10 en GhSOS3 genen op de VIGS, WT en positief gecontroleerde planten onder normale omstandigheden (NS) PRO-, MDA- en SOD-inhoud in normaal (CK), pYL156-Ctrl, GhSOS3 en pYL156-GhCBL10 zaailingen van MAR85 na zout-alkali stressbehandeling


Methoden:

Genregulerende netwerken en motieven.

We hebben de reeks regelgevende interacties gebruikt voor: E coli uit de dataset in ref. 2, die gebruikmaakt van de informatie die beschikbaar is in de RegulonDB-database 7 en nieuwe interacties biedt die zijn samengesteld uit de literatuur. Er waren 1.409 regelgevende interacties waarbij 121 transcriptiefactoren en 795 doelwitgenen betrokken waren. We hebben 42 FFM's en 30 simkaarten in dit netwerk gevonden. We namen de transcriptiefactoren en hun doelgenen in gist uit de gegevensset in ref. 3, die bestond uit 906 interacties met 109 transcriptiefactoren en 402 doelgenen. Er zijn 131 FFM's en 29 simkaarten in dit netwerk. Het grote aantal FFM's in gist weerspiegelt de uitgebreide interregulatie van transcriptiefactoren in de eukaryoot in vergelijking met de prokaryoot. Details hierover vindt u in de aanvullende nota online.

Identificatie van gedupliceerde genen.

Het detecteren van homologie tussen verre paraloge eiwitten in een organisme is een moeilijke taak vanwege sequentiedivergentie. Maar het is algemeen bekend dat de structuur van een eiwit meer geconserveerd is dan de sequentie. Om op betrouwbare wijze verre relaties tussen E coli en gisteiwitten, gebruikten we driedimensionale structurele domeintoewijzingen van de eiwitten in het netwerk als een maat voor homologie. Als twee eiwitten dezelfde domeinarchitectuur hadden, of een reeks domeinen uit dezelfde eiwitfamilies, namen we aan dat ze afkomstig waren van dezelfde gemeenschappelijke voorouder, zoals ondersteund door analyse van eiwitstructuren 26 en sequenties 27 .

We hebben domeinarchitecturen verkregen uit de domeintoewijzingen in de SUPERFAMILY-database 13 (versie 1.61) voor de eiwitsequenties in de gist en E coli genomen. Evolutionaire informatie over domeinen is inherent aan het classificatieschema van de SCOP-database 28 en de verborgen Markov-modellen van de SUPERFAMILY-database zijn gebaseerd op deze domeinen.

We beschouwden domeinarchitecturen die alleen verschilden door hiaten of herhalingen van domeinen als homoloog, omdat herhalingen soms worden gemist door de structurele toewijzingsmethode. In vergelijking met sequentieclusters gevonden door FASTA 29 van hele sequenties (E-waarde ≤ 0,01 in een grote database, komt overeen met meer dan 80% sequentie), splitst onze methode voor het vergelijken van domeinarchitecturen nooit sequentieclusters. Verschillende sequentieclusters hadden echter dezelfde domeinarchitectuur. Om de dekking van de methode te illustreren, had 48% van alle gisteiwitten in het genoom een ​​domeintoewijzing, terwijl slechts ∼ 5% door FASTA kan worden geclusterd op de hierboven beschreven manier.

Als er een domeintoewijzing was voor slechts één eiwit in een transcriptiefactor-gereguleerd genenpaar, konden we duplicatie alleen traceren als het paar was ingebed in een geschikte netwerktopologie. Als een transcriptiefactor bijvoorbeeld een domeintoewijzing miste maar twee genen reguleerde die homoloog zijn, zouden we nog steeds de evolutie van dergelijke interacties kunnen volgen (Fig. 2b).

Identificatie van dubbele randen en simulatieprocedure.

We hebben de significantie van de gedeelde interacties tussen homologen beoordeeld in vergelijking met een scenario waarin de domeinarchitecturen willekeurig over eiwitten werden geschud. We hebben dit gesimuleerd door de topologie van het echte netwerk te behouden en willekeurig domeinarchitecturen te schudden tussen die knooppunten met informatie over domeinarchitectuur. We hebben de transcriptiefactoren afzonderlijk van doelgenen geschud. We hebben de simulatie 10.000 keer uitgevoerd en elke keer berekenden we het aantal homologe transcriptiefactoren met gedeelde doelen en van homologe doelwitgenen met gedeelde transcriptiefactoren. De fractie homologen met gedeelde interacties was nooit zo hoog als die waargenomen in het echte netwerk in alle 10.000 iteraties van de berekening (aanvullende methoden online).

Informatie over de gebruikte dataset en structurele toewijzingen is beschikbaar op http://www.mrc-lmb.cam.ac.uk/genomes/madanm/net_evol/.

Opmerking: Aanvullende informatie is beschikbaar op de website van Nature Genetics.


Materialen en methodes

Regelgevende interacties

We hebben regelgevende interacties verkregen van RegulonDB 5.6 [1]. Na het verwijderen van RNA-genen en pseudogenen, en de huishoudsigmafactor RpoD, hadden we 159 gekarakteriseerde TF's, 1.354 gereguleerde genen en 3.085 regulerende interacties daartussen. Een paar van de TF's zijn in deze gevallen heterodimeren, we hebben slechts één van de twee subeenheden geanalyseerd. We onderzochten ook TF- en genannotaties in EcoCyc [47] en bekende operons in RegulonDB.

Evolutionaire geschiedenis van TF's

We hebben de evolutionaire geschiedenis van TF's onderzocht door de genenboom te vergelijken met de soortenboom. Als eerste stap gebruikten we snel aangrenzende bomen [48] voor COG's, PFams en AD hoc BLAST-families uit de MicrobesOnline-boombrowser [49] en we vergeleken de genenbomen met de MicrobesOnline-soortenboom. (De meest relevante delen van de soortenboom zijn weergegeven in figuur 2 en de constructie van de soortboom wordt hieronder beschreven.)

Gegeven een genenboom en een soortenboom, identificeerden we horizontale overdrachtsgebeurtenissen met behulp van een combinatie van de genfylogenie en het patroon van genaanwezigheid en genafwezigheid. Als een sterk ondersteunde clade in de genenboom aanwezig was in ongelijksoortige genomen, zodat drie of meer deletiegebeurtenissen nodig zouden zijn om de verspreiding van de onderfamilie op de soortboom te verklaren, dan hebben we een HGT-gebeurtenis toegewezen. Deleties in de sterk gereduceerde genomen van de insecten-endosymbiont-groep (Buchnera, Wigglesworthia, en Blochmannia) werden niet als bewijs voor HGT beschouwd. Aangezien HGT vaak voorkomt bij bacteriën, is de drempel van drie of meer deletiegebeurtenissen conservatief. Met name bij hogere drempels is een groot aantal deleties van voorouderlijke bacteriën nodig om de huidige verdeling van genen te verklaren, wat vereist dat de voorouderlijke bacteriën onredelijk grote genomen hebben [50, 51].

Als de genenboom paralogen vertoonde en de fylogenie van twee subgroepen consistent was met de soortenboom, dan hebben we een genduplicatie-gebeurtenis toegewezen. Geschiedenissen die niet aan een van deze criteria voldeden, werden als inheems beschouwd, zelfs als er kleine verschillen waren tussen de soortboom en de genenboom. Als een gen bewijs vertoonde voor zowel HGT als duplicatie, dan gebruikten we de meest recente gebeurtenis om de oorsprong van het gen te classificeren (bijvoorbeeld snorren/rbsR, in figuur 4, wordt geclassificeerd als een duplicatie).

Toen we eenmaal een voorlopige classificatie hadden, hebben we deze bevestigd door te controleren op homologen (door BLASTp) die mogelijk afwezig zijn in de genfamilie (vanwege de beperkingen van de toewijzing van de genfamilie) en door een kleinere en nauwkeurigere fylogenetische boom te bouwen voor een geselecteerde subset van homologen. Om deze bomen van hogere kwaliteit te bouwen, gebruikten we MUSCLE [52] om de eiwitcoderende sequenties uit te lijnen, Gblocks om de uitlijningen in te korten [53], en zowel TreePuzzle [54] als phyml [55] om fylogenetische bomen te bouwen.

We vroegen ook of de vermeende HGT-gebeurtenis de E coli afstamming. Bijvoorbeeld, zoals gezien voor crp (Figuur 5), suggereert de boom een ​​overdrachtgebeurtenis van E colivoorouders van een andere afstamming, maar dit betekent niet dat E coli's voorouders verwierven het gen door HGT. Deze genen werden geclassificeerd als inheems.

We nemen aan dat deze genen van andere bacteriën naar de E coli afstamming, in plaats van vice versa, hoewel het theoretisch mogelijk is dat deze TF's zijn ontstaan ​​in de E coli afstamming relatief recent en werden vervolgens elders overgebracht. Omdat de meeste TF's tot grote families behoren die in veel andere bacteriële geslachten voorkomen, en ook omdat deze TF's vaak verre paralogen hebben in E coli, een recente oorsprong van deze families binnen de E coli afstamming is niet aannemelijk.

Soorten boom

De soortenboom werd berekend uit bomen met maximale waarschijnlijkheid van aaneengeschakelde eiwitten met behulp van matrixweergave van spaarzaamheid [56]. De bomen met maximale waarschijnlijkheid werden gegenereerd op basis van een gidsboom van lagere kwaliteit door voor elk intern knooppunt in de gidsboom een ​​klein aantal afstammelingen en close out-groepen te selecteren (minder dan 20 genomen in totaal). Gezien deze kleine groep genomen, hebben we COG's [22] geïdentificeerd die als een enkele kopie in elk genoom aanwezig zijn. Omdat deze groepen genomen meestal uit naaste verwanten bestonden, waren er doorgaans honderden geconserveerde genen. We hebben elke COG uitgelijnd en getrimd, opnieuw met behulp van MUSCLE en Gblocks, en de uitlijningen aaneengeschakeld. Omdat de resulterende uitlijningen vaak erg groot waren, hebben we invariante sites verwijderd en als de uitlijning nog steeds meer dan 5.000 posities bevatte, namen we een willekeurige steekproef van sites. Vervolgens bouwden we een boom met phyml, met behulp van vier categorieën van evolutionaire snelheden. We converteerden de bomen naar een matrix van karakters [56] en gebruikten PAUP 4.0b10 [57] om de meest spaarzame boom af te leiden. Ten slotte hebben we PHYLIP [58] gebruikt om maximale waarschijnlijkheidstaklengtes af te leiden, met gamma-verdeelde snelheden, uit een aaneengeschakelde uitlijning van 74 sterk geconserveerde eiwitten.

Een uitgebreidere beschrijving van de soortboomconstructie is online beschikbaar [49]. De boom bevat geen bootstrap-waarden, maar de meeste bronbomen hebben sterke bootstrap-ondersteuning en zijn congruent met elkaar (gegevens niet getoond). De meest relevante onzekerheden zijn de plaatsing van Fotorhabdus, en of Sodalis moeten worden gegroepeerd met de andere insecten-endosymbionten (Buchnera enzovoort).

Steekproef van regelgevers

We hebben alle top 20 wereldwijde regelgevers onderzocht, die goed zijn voor ongeveer tweederde van de regelgevende interacties in RegulonDB. Voor naburige regulatoren onderzochten we degene die werden beschreven in een eerdere compilatie van regulerende interacties, ColiNet 1.1 [59], die we in de beginfase van dit project gebruikten. Hoewel dit geen echt willekeurige steekproef is, weten we geen enkele reden waarom de meer recent gekarakteriseerde regulatoren een verschillende evolutionaire geschiedenis zouden hebben. We onderzochten een willekeurige steekproef van 23 van de andere gekarakteriseerde regulatoren in RegulonDB. Nogmaals, dit waren voornamelijk regelgevers die werden beschreven in ColiNet.

We identificeerden vermeende regelgevers in E coli K12 door te zoeken naar genontologie GO:0003700 ('transcriptiefactoractiviteit') met behulp van de MicrobesOnline-database. We hebben willekeurig 20 hiervan geselecteerd om te onderzoeken, en we hebben geverifieerd dat voorspeld was dat ze helix-turn-helix-domeinen bevatten (met behulp van InterPro), dat ze niet waren geannoteerd als restrictie-enzymen of DNA-modificatie-enzymen, en dat ze niet al waren gekarakteriseerd volgens EcoCyc [47].

Automatische identificatie van HGT-genen

Om HGT automatisch te identificeren, hebben we gezocht naar genen die nauwe homologen missen in opeenvolgende groepen verwante bacteriën (Figuur 9). We definieerden 'nabije' homologen op basis van BLAST-scores en om de vermeende HGT te bevestigen, gebruikten we een kwartettest (zie figuur 9). Deze benadering staat in contrast met benaderingen die sterk afhankelijk zijn van de genenboom [13, 24] en lijkt meer op aanwezigheid/afwezigheidsanalyses [60, 61]. Hoewel de methode conservatief is en veel HGT-gebeurtenissen mist (gegevens niet getoond), classificeert ze ongeveer een kwart van de eiwitcoderende genen in E coli K12 als HGT, wat een voldoende groot monster oplevert voor analyse.

Geautomatiseerde identificatie van HGT-genen. We onderzochten de hoogste scores van de Basic Local Alignment Search Tool (BLAST) van homologen binnen groepen genomen op toenemende afstand van Escherichia coli. Als de BLAST-score aanzienlijk lager was (met een factor 1,3) in twee opeenvolgende groepen ten opzichte van de beste score in verder verwijderde genomen, dan werd het gen beschouwd als een kandidaat voor horizontale genoverdracht (HGT). Met dergelijke kandidaten hebben we vervolgens een kwartettest gebruikt om te bepalen of de beste hit van het verder verwijderde genoom daadwerkelijk nauwer verwant was aan de E coli gen dan de beste treffers van intermediaire genomen. De kwartettest bevestigde HGT in 92% van deze gevallen, en voor 71% van de genen waarvan de kwartettopologie HGT aangaf, werd de topologie sterk ondersteund (P < 0,05, door Shimodaira-Hasegawa-test in boompuzzel [54]). 'HPVS' verwijst naar: Haemophilus, Pasteurella, Vibrio, Shewanellaen verwante soorten.

De kwartettest werd niet uitgevoerd als er geen homoloog meer op afstand was in elk van de groepen van genomen die goede treffers op het gen 'misten', omdat we in deze gevallen geen vier genen hebben om een ​​kwartet uit te vormen. Als we een gen van elke groep genomen hadden, brachten we de vier genen in lijn met MUSCLE, verwijderden we posities met gaten en testten we de waarschijnlijkheid van alle drie de topologieën met boompuzzel [54], met behulp van gamma-gedistribueerde evolutionaire snelheden.

Geshuffled regelgevend netwerk

Om te testen of de regelgevende overeenkomsten tussen paralogen vaker voorkwamen dan we bij toeval zouden verwachten, gebruikten we een eenvoudige nulhypothese dat het regelgevende netwerk willekeurig evolueert. Deze nulhypothese komt overeen met een simplistisch neutraal model waarin bindingsplaatsen voor regulatoren neutraal ontstaan, en bindingssites voor globale regulatoren vaker dan voor andere regulatoren, zodat ze meer genen reguleren.

Om deze nulhypothese te testen, hebben we het netwerk geschud, zodat het aantal interacties voor elke TF en voor elk gereguleerd gen ongewijzigd was (vergelijkbaar met het rapport van Maslov en Sneppen [62] maar voor regulerende netwerken). Meer precies, we selecteerden de gereguleerde genen voor elke TF door bemonstering zonder vervanging uit de volledige set gereguleerde genen. We hebben delen van het netwerk opnieuw bemonsterd om dubbele interacties tussen gereguleerde genen en TF's te voorkomen. Dit gaf netwerken met dezelfde graadverdeling als het oorspronkelijke netwerk, zowel voor TF's als voor gereguleerde genen.

Een alternatieve randomisatietest is om de paralogische relaties te permuteren in plaats van de regulerende netwerken. (Zie het rapport van Teichmann en Babu [4], hoewel ze de terminologie van 'domeinarchitecturen' gebruiken in plaats van paralogie.) Deze test bevestigde dat convergente evolutie vaker voorkomt in het echte netwerk dan bij toeval verwacht. in Tabel 1 kwamen vaker voor in het echte netwerk dan in 999 of meer van de 1.000 paralogische shuffles die we uitvoerden.

Bindingssites voorspellen voor wereldwijde regelgevers

We hebben gekarakteriseerde CRP-bindingsplaatsen verkregen in E coli van DPInteract [34]. We hebben deze sites uitgelijnd met MEME [63], de uitlijning omgezet naar een gewichtsmatrix met palindroomsymmetrie en patser [64] gebruikt om naar sites te zoeken. We zochten van -200 tot +100 ten opzichte van het startcodon van elk gen, en we beschouwden alleen potentiële sites met een score van 6,0 bits of hoger. Deze afkapwaarde is vrij zwak en leidt tot een hoge gevoeligheid, maar een bescheiden specificiteit waar we sites in vonden E coli voor 13 van de 16 CRP-gereguleerde genen die we onderzochten, maar 13% van willekeurig geselecteerde stroomopwaartse regio's voor xenologen van E coli genen hadden een hit op 6,0 bits of hoger. Desalniettemin is het onwaarschijnlijk dat de xenologe CRP-sites in Tabel 2 toevallig zijn ontstaan yiaK en gntK hits hebben van meer dan 10 bits, wat voorkomt in minder dan 1% van de stroomopwaartse regio's, en araB heeft twee nabijgelegen locaties, wat coöperatieve binding suggereert en het is ook onwaarschijnlijk dat dit bij toeval gebeurt.

Analyses voor andere wereldwijde regulatoren die gewichtsmatrices in DPInteract hebben, werden op dezelfde manier uitgevoerd, maar zonder de gewichtsmatrix te dwingen palindroom te zijn. Sommige sigmafactoren hebben meerdere modellen, in welk geval we de beste score voor elk model hebben gebruikt. De gewichtsmatrices voor lrp en fis werden niet gebruikt omdat ze een slechte specificiteit hebben [34].


Referenties

Lee TI, Rinaldi NJ, Robert F, Odom DT, Bar-Joseph Z, Gerber GK, Hannett NM, Harbison CT, Thompson CM, Simon I, et al: Transcriptionele regelgevende netwerken in Saccharomyces cerevisiae. Wetenschap. 2002, 298: 799-804. 10.1126/wetenschap.1075090.

Stormo GD: DNA-bindingsplaatsen: representatie en ontdekking. Bio-informatica. 2000, 16: 16-23. 10.1093/bioinformatica/16.1.16.

Cliften P, Sudarsanam P, Desikan A, Fulton L, Fulton B, Majors J, Waterston R, Cohen BA, Johnston M: functionele kenmerken vinden in Saccharomyces genomen door fylogenetische footprinting. Wetenschap. 2003, 301: 71-76. 10.1126/wetenschap.1084337.

Kellis M, Patterson N, Endrizzi M, Birren B, Lander ES: Sequentiebepaling en vergelijking van gistsoorten om genen en regulerende elementen te identificeren. Natuur. 2003, 423: 241-254. 10.1038/natuur01644.

Aparicio S, Morrison A, Gould A, Gilthorpe J, Chaudhuri C, Rigby P, Krumlauf R, Brenner S: detectie van geconserveerde regulerende elementen met het modelgenoom van de Japanse kogelvis, Fugu rubripes. Proc Natl Acad Sci USA. 1995, 92: 1684-1688.

Pritsker M, Liu YC, Beer MA, Tavazoie S: ontdekking van transcriptiefactorbindingsplaatsen in het hele genoom met behulp van conservering op netwerkniveau. Genoom onderzoek. 2004, 14: 99-108. 10.1101/gr.1739204.

Hughes JD, Estep PW, Tavazoie S, Church GM: Computational identificatie van cis -regulerende elementen geassocieerd met groepen functioneel verwante genen in Saccharomyces cerevisiae. J Mol Biol. 2000, 296: 1205-1214. 10.1006/jmbi.2000.3519.

Zhu J, Zhang MQ: SCPD: een promotordatabase van de gist Saccharomyces cerevisiae. Bio-informatica. 1999, 15: 607-611. 10.1093/bioinformatica/15.7.607.

Yamaguchi-Iwai Y, Dancis A, Klausner RD: AFT1: een bemiddelaar van door ijzer gereguleerde transcriptionele controle in Saccharomyces cerevisiae. EMBO J. 1995, 14: 1231-1239.

Beer MA, Tavazoie S: Voorspellen van genexpressie van sequentie. Cel. 2004, 117: 185-198. 10.1016/S0092-8674(04)00304-6.

Erives A, Levine M: Coördinatenversterkers delen gemeenschappelijke organisatorische kenmerken in het Drosophila-genoom. Proc Natl Acad Sci USA. 2004, 101: 3851-3856. 10.1073/pnas.0400611101.

Sudarsanam P, Pilpel Y, Church GM: Genoombrede gelijktijdige aanwezigheid van promotorelementen onthult een cis-regulerende cassette van rRNA-transcriptiemotieven in Saccharomyces cerevisiae. Genoom onderzoek. 2002, 12: 1723-1731. 10.1101/gr.301202.

Blaiseau PL, Thomas D: Meerdere transcriptionele activatiecomplexen binden de gistactivator Met4 aan DNA. EMBO J. 1998, 17: 6327-6336. 10.1093/emboj/17.21.6327.

Chiang DY, Moses AM, Kellis M, Lander ES, Eisen MB: Fylogenetisch en ruimtelijk geconserveerde woordparen geassocieerd met genexpressieveranderingen in gisten. Genoom Biol. 2003, 4: R43-10.1186/gb-2003-4-7-r43.

Davidson EH: Genomische regelgevingssystemen. 2001, San Diego, Californië: Academische pers

Coghlan A, Wolfe KH: viervoudig snellere genoomherschikking in nematoden dan in Drosophila. Genoom onderzoek. 2002, 12: 857-867. 10.1101/gr.172702.

Maduro MF, Rothman JH: Het maken van wormdarmen: het genregulerende netwerk van de Caenorhabditis elegans endoderm. Dev Biol. 2002, 246: 68-85. 10.1006/dbio.2002.0655.

Cui M, Han M: Cis-regelgevingsvereisten voor vulvale celspecifieke expressie van de Caenorhabditis elegans fibroblastgroeifactorgen egl-17. Dev Biol. 2003, 257: 104-116. 10.1016/S0012-1606(03)00033-2.

Gaudet J, Mango SE: regulering van organogenese door de Caenorhabditis elegans FoxA-eiwit PHA-4. Wetenschap. 2002, 295: 821-825. 10.1126/wetenschap.1065175.

Maduro MF, Meneghini MD, Bowerman B, Broitman-Maduro G, Rothman JH: beperking van mesendoderm tot een enkele blastomeer door de gecombineerde werking van SKN-1 en een GSK-3-homoloog wordt gemedieerd door MED-1 en -2 in C. elegans. Mol cel. 2001, 7: 475-485. 10.1016/S1097-2765(01)00195-2.

Harfe BD, Fire A: spier- en zenuwspecifieke regulatie van een nieuwe homeodomeinfactor van de NK-2-klasse Caenorhabditis elegans. Ontwikkeling. 1998, 125: 421-429.

Jantsch-Plunger V, Fire A: combinatorische structuur van een lichaamsspierspecifieke transcriptionele versterker in Caenorhabditis elegans. J Biol Chem. 1994, 269: 27021-27028.

Tsukiyama T, Becker PB, Wu C: ATP-afhankelijke nucleosoomverstoring bij een warmteschokpromotor gemedieerd door binding van GAGA-transcriptiefactor. Natuur. 1994, 367: 525-532. 10.1038/367525a0.

King-Jones K, Korge G, Lehmann M: De helix-loop-helix-eiwitten dAP-4 en dochterloos binden zowel in vitro als in vivo aan SEBP3-plaatsen die nodig zijn voor transcriptionele activering van het Drosophila-gen Sgs-4. J Mol Biol. 1999, 291: 71-82. 10.1006/jmbi.1999.2963.

Krause M, Fire A, Harrison SW, Priess J, Weintraub H: CeMyoD-accumulatie definieert het lot van de spiercel van de lichaamswand tijdens C. elegans embryogenese. Cel. 1990, 63: 907-919. 10.1016/0092-8674(90)90494-Y.

Hu YF, Luscher B, Admon A, Mermod N, Tjian R: Transcriptiefactor AP-4 bevat meerdere dimerisatiedomeinen die de specificiteit van dimeer reguleren. Genen Dev.1990, 4: 1741-1752.

Blackwell TK, Weintraub H: Verschillen en overeenkomsten in DNA-bindingsvoorkeuren van MyoD- en E2A-eiwitcomplexen onthuld door selectie van bindingsplaatsen. Wetenschap. 1990, 250: 1104-1110.

Krause M, Park M, Zhang J, Yuan J, Harfe B, Xu S, Greenwald I, Cole M, Paterson B, Vuur A: A C. elegans E/Daughterless bHLH-eiwit markeert neuronale maar niet dwarsgestreepte spierontwikkeling. Ontwikkeling. 1997, 124: 2179-2189.

Furuyama T, Nakazawa T, Nakano I, Mori N: Identificatie van de differentiële distributiepatronen van mRNA's en consensus-bindende sequenties voor DAF-16-homologen van muizen. Biochem J. 2000, 349: 629-634. 10.1042/0264-6021:3490629.

Murphy CT, McCarroll SA, Bargmann CI, Fraser A, Kamath RS, Ahringer J, Li H, Kenyon C: genen die stroomafwaarts van DAF-16 werken om de levensduur van Caenorhabditis elegans. Natuur. 2003, 424: 277-283. 10.1038/natuur01789.

Lee SS, Kennedy S, Tolonen AC, Ruvkun G: DAF-16-doelgenen die controle C. elegans levensduur en stofwisseling. Wetenschap. 2003, 300: 644-647. 10.1126/wetenschap.1083614.

Gronostajski RM: Analyse van nucleaire factor I-binding aan DNA met behulp van gedegenereerde oligonucleotiden. Nucleïnezuren Res. 1986, 14: 9117-9132.

Lee W, Mitchell P, Tjian R: Gezuiverde transcriptiefactor AP-1 interageert met TPA-induceerbare versterkerelementen. Cel. 1987, 49: 741-752. 10.1016/0092-8674(87)90612-X.

Kockel L, Homsy J, Bohmann D: Drosophila AP-1: lessen van een ongewerveld dier. oncogeen. 2001, 20: 2347-2364. 10.1038/sj.onc.1204300.

Karin M, Liu Z, Zandi E: AP-1-functie en -regeling. Curr Opin Cell Biol. 1997, 9: 240-246. 10.1016/S0955-0674(97)80068-3.

Grandori C, Cowley SM, James LP, Eisenman RN: Het Myc/Max/Mad-netwerk en de transcriptionele controle van celgedrag. Annu Rev Cell Dev Biol. 2000, 16: 653-699. 10.1146/annurev.cellbio.16.1.653.

Rice DA, Mouw AR, Bogerd AM, Parker KL: Een gedeeld promotorelement reguleert de expressie van drie steroïdogene enzymen. Mol Endocrinol. 1991, 5: 1552-1561.

Ueda H, Sun GC, Murata T, Hirose S: ​​een nieuw DNA-bindend motief grenst aan het zinkvingerdomein van de insect-nucleaire hormoonreceptor FTZ-F1 en het embryonale lange terminale herhalingsbindende eiwit van muizen. Mol Cell Biol. 1992, 12: 5667-5672.

Shaywitz AJ, Greenberg ME: CREB: een stimulus-geïnduceerde transcriptiefactor geactiveerd door een diverse reeks extracellulaire signalen. Annu Rev Biochem. 1999, 68: 821-861. 10.1146/annurev.biochem.68.1.821.

Dijk MAV, Voorhoeve PM, Murre C: Pbx1 wordt omgezet in een transcriptionele activator bij verwerving van het N-terminale gebied van E2A bij pre-B-cel acute lymfoblastoïde leukemie. Proc Natl Acad Sci U S A. 1993, 90: 6061-6065.

Manak JR, Mathies LD, Scott MP: Regulatie van een decapentaplegische middendarmversterker door homeotische eiwitten. Ontwikkeling. 1994, 120: 3605-3619.

Mauhin V, Lutz Y, Dennefeld C, Alberga A: Definitie van het DNA-bindingsplaatsrepertoire voor de Drosophila-transcriptiefactor SLAK. Nucleïnezuren Res. 1993, 21: 3951-3957.

Huber HE, Edwards G, Goodhart PJ, Patrick DR, Huang PS, Ivey-Hoyle M, Barnett SF, Oliff A, Heimbrook DC: transcriptiefactor E2F bindt DNA als een heterodimeer. Proc Natl Acad Sci U S A. 1993, 90: 3525-3529.

Boxem M, vanden Heuvel S: C. elegans klasse B synthetische multivulva-genen werken in G(1)-regulatie. Curr Biol. 2002, 12: 906-911. 10.1016/S0960-9822(02)00844-8.

Ceol CJ, Horvitz HR: dpl-1 DP en efl-1 E2F werken samen met lin-35 Rb om Ras-signalering in C. elegans ontwikkeling van de vulva. Mol cel. 2001, 7: 461-473. 10.1016/S1097-2765(01)00194-0.

Kwon JY, Hong M, Choi MS, Kang S, Duke K, Kim S, Lee S, Lee J: Ethanol-responsgenen en hun regulatie geanalyseerd door een microarray en vergelijkende genomische benadering in de nematode Caenorhabditis elegans. Genomica. 2004, 83: 600-614. 10.1016/j.ygeno.2003.10.08.

Lund J, Tedesco P, Duke K, Wang J, Kim SK, Johnson TE: transcriptioneel profiel van veroudering in C. elegans. Curr Biol. 2002, 12: 1566-1573. 10.1016/S0960-9822(02)01146-6.

Ohler U, Yekta S, Lim LP, Bartel DP, Burge CB: Patronen van conservering van flankerende sequenties en een karakteristiek stroomopwaarts motief voor identificatie van microRNA-gen. RNA. 2004, 10: 1309-1322. 10.1261/rna.5206304.

Celniker SE, Rubin GM: The Drosophila melanogaster genoom. Annu Rev Genomics Hum Genet. 2003, 4: 89-117. 10.1146/annurev.genom.4.070802.110323.

Matsukage A, Hirose F, Hayashi Y, Hamada K, Yamaguchi M: De DRE-sequentie TATCGATA, een vermoedelijk promotor-activerend element voor Drosophila melanogaster celproliferatie-gerelateerde genen. Gen. 1995, 166: 233-236. 10.1016/0378-1119(95)00586-2.

Choi T, Cho N, Oh Y, Yoo M, Matsukage A, Ryu Y, Han K, Yoon J, Baek K: Het DNA-replicatiegerelateerde element (DRE)-bindende factor (DREF)-systeem kan betrokken zijn bij de expressie van de Drosophila melanogaster TBP-gen. FEBS Lett. 2000, 483: 71-77. 10.1016/S0014-5793(00)02085-8.

Park SY, Kim YS, Yang DJ, Yoo MA: Transcriptionele regulatie van het Drosophila catalase-gen door het DRE / DREF-systeem. Nucleïnezuren Res. 2004, 32: 1318-1324. 10.1093/nar/gkh302.

Hanes SD, Brent R: een genetisch model voor interactie van de homeodomeinherkenningshelix met DNA. Wetenschap. 1991, 251: 426-430.

Anderson MG, Perkins GL, Chittick P, Shrigley RJ, Johnson WA: Drifter, een Drosophila POU-domein transcriptiefactor, is vereist voor correcte differentiatie en migratie van tracheale cellen en middellijn glia. Genen Dev. 1995, 9: 123-137.

Bhat KM, Poole SJ, Schedl P: de mitimere- en pdm1-genen werken samen tijdens de specificatie van de RP2/sib-lijn in Drosophila neurogenese. Mol Cell Biol. 1995, 15: 4052-4063.

Junger MA, Rintelen F, Stocker H, Wasserman JD, Vegh M, Radimerski T, Greenberg ME, Hafen E: De Drosophila Forkhead-transcriptiefactor FOXO bemiddelt de vermindering van het aantal cellen geassocieerd met verminderde insulinesignalering. J Biol. 2003, 2: 20-10.1186/1475-4924-2-20.

Erickson JW, Cline TW: De belangrijkste aspecten van het primaire geslachtsbepalingsmechanisme zijn in het hele geslacht behouden Drosophila. Ontwikkeling. 1998, 125: 3259-3268.

Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, An P, et al: initiële sequencing en vergelijkende analyse van het muizengenoom. Natuur. 2002, 420: 520-562. 10.1038/natuur01262.

Suske G: De Sp-familie van transcriptiefactoren. Gen. 1999, 238: 291-300. 10.1016/S0378-1119(99)00357-1.

Ramji DP, Foka P: CCAAT/enhancer-bindende eiwitten: structuur, functie en regulatie. Biochem J. 2002, 365: 561-575.

Latchman D: Eukaryote transcriptiefactoren. 1997, Londen: Academic Press

Vo N, Goodman RH: CREB-bindend eiwit en p300 in transcriptionele regulatie. J Biol Chem. 2001, 276: 13505-13508.

Bernards R: Transcriptieregulatie. De Myc-schakelaar omdraaien. Curr Biol. 1995, 5: 859-861. 10.1016/S0960-9822(95)00173-4.

Nasrin N, Ercolani L, Denaro M, Kong XF, Kang I, Alexander M: Een insulineresponselement in het glyceraldehyde-3-fosfaatdehydrogenase-gen bindt een nucleair eiwit dat wordt geïnduceerd door insuline in gekweekte cellen en door voedingsmanipulaties in vivo. Proc Natl Acad Sci U S A. 1990, 87: 5273-5277.

Suzuki F, Goto M, Sawa C, Ito S, Watanabe H, Sawada J, Handa H: Functionele interacties van transcriptiefactor menselijke GA-bindende eiwitsubeenheden. J Biol Chem. 1998, 273: 29302-29308. 10.1074/jbc.273.45.29302.

Zimmermann AG, Wright KL, Ting JP, Mitchell BS: Regulatie van inosine-5'-monofosfaatdehydrogenase type II-genexpressie in menselijke T-cellen. Rol voor een nieuwe 5'-palindroom-octameersequentie. J Biol Chem. 1997, 272: 22913-22923. 10.1074/jbc.272.36.22913.

Gottlieb S, Hanes SD, Golden JA, Oakey RJ, Budarf ML: Goosecoid-achtige, een gen verwijderd in DiGeorge en velocardiofaciale syndromen, herkent DNA met een bicoïde-achtige specificiteit en wordt uitgedrukt in de zich ontwikkelende muizenhersenen. Hum Mol Genet. 1998, 7: 1497-1505. 10.1093/hmg/7.9.1497.

Singh H, Sen R, Baltimore D, Sharp PA: een nucleaire factor die bindt aan een geconserveerd sequentiemotief in transcriptionele controle-elementen van immunoglobuline-genen. Natuur. 1986, 319: 154-158. 10.1038/319154a0.

Nie Z, Mei Y, Ford M, Rybak L, Marcuzzi A, Ren H, Stiles GL, Ramkumar V: Oxidatieve stress verhoogt A1-adenosinereceptorexpressie door nucleaire factor kappa B. Mol Pharmacol te activeren. 1998, 53: 663-669.

Glasgow JN, Wood T, Perez-Polo JR: Identificatie en karakterisering van nucleaire factor-κB-bindingsplaatsen in de muizenbcl-x-promoter. JNeurchem. 2000, 75: 1377-1389. 10.1046/j.1471-4159.2000.0751377.x.

Whitfield ML, Sherlock G, Saldanha AJ, Murray JI, Ball CA, Alexander KE, Matese JC, Perou CM, Hurt MM, Brown PO, Botstein D: identificatie van genen die periodiek tot expressie worden gebracht in de menselijke celcyclus en hun expressie in tumoren. Mol Biol-cel. 2002, 13: 1977-2000. 10.1091/mbc.02-02-0030..

Rustici G, Mata J, Kivinen K, Lio P, Penkett CJ, Burns G, Hayles J, Brazma A, Nurse P, Bahler J: Periodiek genexpressieprogramma van de splijtingsgistcelcyclus. Nat Genet. 2004, 36: 809-817. 10.1038/ng1377.

Stormo GD, Fields DS: specificiteit, vrije energie en informatie-inhoud in eiwit-DNA-interacties. Trends Biochem Sci. 1998, 23: 109-113. 10.1016/S0968-0004(98)01187-6.

Kalir S, Alon U: een kwantitatieve blauwdruk gebruiken om de dynamiek van het flagella-gennetwerk te herprogrammeren. Cel. 2004, 117: 713-720. 10.1016/j.cell.2004.05.010.

Waterman MS, Eggert M: een nieuw algoritme voor de beste subsequentie-uitlijning met toepassing op tRNA-rRNA-vergelijkingen. J Mol Biol. 1987, 197: 723-728. 10.1016/0022-2836(87)90478-5.

Wolfertstetter F, Frech K, Herrmann G, Werner T: Identificatie van functionele elementen in niet-uitgelijnde nucleïnezuursequenties door een nieuw tupel-zoekalgoritme. Computerapp Biosci. 1996, 12: 71-80.

Zhang MQ: Identificatie van menselijke genkernpromoters in silico. Genoom onderzoek. 1998, 8: 319-326.

Curwen V, Eyras E, Andrews TD, Clarke L, Mongin E, Searle SM, Clamp M: Het ENSEMBL automatische genannotatiesysteem. Genoom onderzoek. 2004, 14: 942-950. 10.1101/gr.1858004.

Human Genome Sequencing Center aan het Baylor College of Medicine: Drosophila-genoomproject. [http://www.hgsc.bcm.tmc.edu/projects/drosophila]

Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, et al: Genontologie: hulpmiddel voor de eenwording van biologie. Het Gene Ontology Consortium. Nat Genet. 2000, 25: 25-29. 10.1038/75556.

Mewes HW, Amid C, Arnold R, Frishman D, Guldener U, Mannhaupt G, Munsterkotter M, Pagel P, Strack N, Stumpflen V, et al: MIPS: analyse en annotatie van eiwitten uit hele genomen. Nucleïnezuren Res. 2004, D41-D44. 10.1093/nar/gkh092. 32 Database

Gusfield D: Algoritmen op snaren, bomen en reeksen. 1997, Cambridge, VK: Cambridge University Press

Press WH, Flannery BP, Teukolsky SA, Vetterling WT: Numerieke recepten in C: The Art of Scientific Computing. 1993, Cambridge, VK: Cambridge University Press

Pilpel Y, Sudarsanam P, Church GM: Identificatie van regelgevende netwerken door combinatorische analyse van promotorelementen. Nat Genet. 2001, 29: 153-159. 10.1038/ng724.

Yuh CH, Bolouri H, Davidson EH: Genomic cis -regulatoire logica: experimentele en computationele analyse van een zee-egel-gen. Wetenschap. 1998, 279: 1896-1902. 10.1126/wetenschap.279.5358.1896.

Needleman SB, Wunsch CD: een algemene methode die van toepassing is op het zoeken naar overeenkomsten in de aminozuursequentie van twee eiwitten. J Mol Biol. 1970, 48: 443-453.

Matys V, Fricke E, Geffers R, Gössling E, Haubrock M, Hehl R, Hornischer K, Karas D, Kel AE, Kel-Margoulis OV, et al: TRANSFAC: transcriptionele regulatie, van patronen tot profielen. Nucleïnezuren Res. 2003, 31: 374-378. 10.1093/nar/gkg108.

Gollub J, Ball CA, Binkley G, Demeter J, Finkelstein DB, Hebert JM, Hernandez-Boussard T, Jin H, Kaloper M, Matese JC, et al: The Stanford Microarray Database: tools voor gegevenstoegang en kwaliteitsbeoordeling. Nucleïnezuren Res. 2003, 31: 94-96. 10.1093/nar/gkg078.

Stuart JM, Segal E, Koller D, Kim SK: een gen-co-expressienetwerk voor wereldwijde ontdekking van geconserveerde genetische modules. Wetenschap. 2003, 302: 249-255. 10.1126/wetenschap.1087447.

Lieb JD, Liu X, Botstein D, Brown PO: Promotor-specifieke binding van Rap1 onthuld door genoombrede kaarten van eiwit-DNA-associatie. Nat Genet. 2001, 28: 327-334. 10.1038/ng569.

Balasubramanian B, Lowry CV, Zitomer RS: De Rox1-repressor van de Saccharomyces cerevisiae hypoxische genen is een specifiek DNA-bindend eiwit met een motief met een hoge mobiliteitsgroep. Mol Cell Biol. 1993, 13: 6071-6078.

Gasch AP, Spellman PT, Kao CM, Carmel-Harel O, Eisen MB, Storz G, Botstein D, Brown PO: Genomische expressieprogramma's in de reactie van gistcellen op veranderingen in de omgeving. Mol Biol-cel. 2000, 11: 4241-4257.


Discussie

Fenotypische verschillen tussen orthologe genen van mensen en muizen worden vaak beschouwd als een falen van muismodellen en worden in bepaalde gevallen zelden gerapporteerd (Bakker et al. 2013 Chandrasekera en Pippin 2013 Seok et al. 2013). Het is dus nog steeds onduidelijk welke orthologe genen significante fenotypische veranderingen hebben ondergaan en welke soorten moleculaire evolutionaire gebeurtenissen hebben bijgedragen aan de fenotypische verschillen. In de huidige studie hebben we voor het eerst een geïntegreerde benadering voor genotype-fenotype-vergelijking vastgesteld om verschillende moleculaire evolutionaire gebeurtenissen te onthullen die waarschijnlijk bijdragen aan fenotypeverschillen als gevolg van verschillen tussen het genoom van mensen en muizen. We bedachten een kwantitatief PS-scoresysteem (fig. 1) om fenotypevergelijkingen op genoomschaal in kaart te brengen om de overeenstemming of discrepantie in fenotypes van menselijke ziekten en muizen te analyseren. We ontdekten dat fenotypische discrepanties gedeeltelijk werden verklaard door divergentie in niet-coderende regulerende elementen en transcriptomische profielen in plaats van verschillen in eiwitcoderende sequenties (fig. 2-4).

PS-scores geven een statistische beoordeling van de significantie van fenotypische overeenkomst in vergelijking met het verwachte model op basis van orthologie-functie-gissingen (fig. 1). We vroegen ons echter af of de nauwkeurigheid van PS-scores wordt beïnvloed door de onvolledigheid van de huidige genotype-fenotype-mapping. We hebben dus bevestigd dat de berekening van PS-scores robuust was bij het verwijderen van 15% van de genotype-fenotype-toewijzingen (Pearson ρ = 0,95), of bij gebruik van oudere versies van de toewijzingsdatabases (ρ = 0,91), waardoor de onvolledigheid van de afbeelding wordt gesimuleerd (aanvullend fig. S16, aanvullend materiaal online). We hebben ook bevestigd dat onze dataset voor fenotypevergelijking niet bevooroordeeld was in de richting van een bepaalde fenotypeklasse, en toonden aan dat deze de huidige gen-fenotypekaarten van mens en muis vertegenwoordigde (aanvullend fig. S17, aanvullend materiaal online). In het bijzonder was het aandeel genen met HPO- en MPO-klassen in onze dataset sterk gecorreleerd met het aandeel in respectievelijk OMIM- en MGI-databases (ρ = 1,00 in OMIM, ρ = 0,98 in MGI), wat aangeeft dat de samenstelling van fenotypetermen in onze dataset een goede weergave geeft van die in de complete genensets. Alles bij elkaar genomen zou onze fenomische benadering met behulp van de PS-score van toepassing kunnen zijn op de vergelijking van de huidige gen-fenotype-relaties tussen de twee soorten.

We vonden dat regulatoire divergentie geassocieerd was met fenotypische verschillen in orthologe genen van mens en muis (fig. 3). De frequente opkomst van fenotypische verschillen kan het gevolg zijn van evolutionaire divergentie tussen soorten in plaats van willekeurige fouten in genotype-fenotype-vergelijkingen. Er werd gemeld dat veranderingen in genregulerende sequenties een bron van fenotypische evolutie zouden kunnen zijn (Carroll 2008 Indjeian et al. 2016). Groepen genen worden vaak samen gereguleerd en hun functies worden beïnvloed door schakelmutaties in regulerende genen (Babu et al. 2004 Voordeckers et al. 2015). We ontdekten inderdaad dat genen die zich in dezelfde route of functionele module bevinden, de neiging hadden om gelijktijdige fenotypische verschillen te vertonen, wat consistent is met eerdere rapporten die suggereerden dat fenotypische veranderingen op een modulaire manier kunnen plaatsvinden (Ryan et al. 2013 Han et al. 2015 Kachroo et al. al. 2015). Uit de LPG-analyse hadden bijvoorbeeld 13 van de 17 Fanconi-anemieroute (FAP) -genen met vergelijkbare PS-scores significante fenotypische verschillen (aanvullende tabel S4, aanvullend materiaal online). Mutaties van FAP-genen van muizen vertonen inderdaad niet de ontwikkelingsafwijkingen die vaak worden waargenomen bij menselijke FA-patiënten (Bakker et al. 2013).

Onze resultaten leveren bewijs dat vergelijkende transcriptomische data-analyse moet worden uitgevoerd om te identificeren in welke weefsels muisgenexpressie een geschikt model is voor menselijke ziekten, en geeft de noodzaak aan om het zorgvuldige gebruik van diermodellen te optimaliseren. Onze resultaten toonden aan dat in veel gevallen veranderingen in weefselspecifieke expressieprofielen tussen soorten fenotypische verschillen tussen orthologe genen van mens en muis kunnen verklaren (fig. 4). Recente vergelijkende transcriptoomgegevens onthulden dat veel orthologe genen van mens/muis verschillende transcriptoomprofielen hebben in verschillende weefsels of celtypen (Forrest et al. 2014 Yue et al. 2014). Vergelijking van transcriptoomgegevens kan van onschatbare waarde zijn om te identificeren welke weefsels of celtypen verband houden met fenotypische veranderingen of het behoud van een bepaald gen tussen mens en modelorganismen (Breschi et al. 2017), aangezien transcriptoomveranderingen worden beschouwd als een "intermediair moleculair fenotype" en een gevolg van genetische variatie die de huidige toestand van een systeem weerspiegelt (dwz een weefsel, orgaan of soort) (Burga en Lehner 2013).

Fenologen, orthologe genen met fenotypes die identiek zijn tussen soorten, zijn nuttig bij het onderzoeken van de moleculaire mechanismen die ten grondslag liggen aan fenotypes van menselijke ziekten door middel van genetische benaderingen van muizen (McGary et al. 2010 McWhite et al. 2015). De ontdekking van fenologen is echter moeilijk omdat frequente fenotypische verschillen worden waargenomen tussen orthologe genen en het in kaart brengen van genotype-fenotype-relaties van mens en muis vaak onvolledig is. We hebben dus weefselspecifieke expressiebehoud in alle orthologe genen van mens en muis onderzocht met behulp van de FANTOM- en ENCODE-databases (aanvullende gegevens S2, aanvullend materiaal online en zie onze begeleidende site https://sbi.postech.ac.kr/w/PS ). Orthologe genen met een hoog expressiebehoud zijn waarschijnlijk nuttig voor het identificeren van vermeende fenologen.

In onze analyse kon divergentie van eiwitcoderende sequenties geen fenotypische verschillen tussen orthologe genen van mens en muis verklaren (fig. 2). Volgens de neutrale theorie van moleculaire evolutie zou sequentiedivergentie van genen het gevolg kunnen zijn van de fixatie van veel willekeurige neutrale mutaties, evenals de positieve selectie van gunstige mutaties, die de adaptieve evolutie van fenotypen beïnvloeden (Orr 2005). Vanwege de hoge complexiteit van het in kaart brengen van genotype-fenotype, konden fenotypische verschillen alleen worden verklaard door de integratie van diverse moleculaire evolutionaire kenmerken die zijn verkregen uit vergelijkingen tussen soorten van multi-omics-benaderingen, inclusief moleculaire evolutionaire kenmerken die verband houden met niet-coderende of coderende sequenties ( Maher 2012 Breschi et al. 2017). Verdere studies over diverse moleculaire evolutionaire gebeurtenissen zijn dus nodig om fenotypische verschillen tussen soorten beter te begrijpen. We verwachten dat onze soortoverschrijdende vergelijking van genotype-fenotype-kaarten in combinatie met het gebruik van gegevens uit multi-omics-benaderingen een waardevolle hulpbron zal blijken te zijn, ook als referentieset voor training en het construeren van computermodellen die de complexe aard van fenotypische verschillen door moleculaire evolutionaire kenmerken (Breschi et al. 2017).


Invoering

Het volwassen menselijk lichaam bestaat uit:

37 biljoen cellen 1 , de functionele eenheden van organismale systemen. Hoewel elke cel bijna identieke genomische informatie bevat, wordt verwacht dat er minstens enkele honderden belangrijke celtypen met verschillende morfologie, gedrag en functies in het menselijk lichaam voorkomen. Afwijking van de voorbestemde identiteit van functionele cellen is een belangrijke oorzaak van menselijke ziekten. Verschillende cellulaire samenstellingen van tumorweefsel kunnen resulteren in verschillende geneesmiddelreacties en prognoses. Ziekte-geassocieerde genetische varianten beïnvloeden alleen bepaalde celtypen, wat functionele validatie van kandidaat-varianten afgeleid van genoombrede associatiestudies uitdagend maakt 2 . Daarom is het begrijpen van de werking van het menselijk lichaam met de cellulaire resolutie het ultieme doel in biologie en geneeskunde.

Onderzoek naar individuele celtypen in vivo is technisch uitdagend. Flowcytometrie-analyse wordt de afgelopen decennia gebruikt voor eencellige profilering 3 , zij het met enkele beperkingen. Ten eerste is het een gerichte analysemethode voor slechts een vooraf geselecteerde set moleculen. Ten tweede kan deze methode, vanwege de spectrale beperking van fluorescerende eiwitten, tot 17 eiwitten tegelijkertijd profileren, wat wordt uitgebreid tot

40 eiwitten door massacytometrie 4 . Onlangs zijn we getuige geweest van een snelle verbetering in eencellige RNA-sequencing (scRNA-seq) -technologie, wat inderdaad een gamechanger is op het gebied van eencellige biologie. De huidige scRNA-seq-technologie kan gemakkelijk volledige transcriptoomgegevens genereren voor honderden tot duizenden cellen uit een enkele sequentiereactie en sleutelgenen identificeren die zijn geassocieerd met elk celtype of elke staat door differentiële expressie-analyse over verschillende cellulaire groepen van vergelijkbaar transcriptoom. Daarom karakteriseren we nu individuele celtypen of toestanden in een weefsel dat over het algemeen is samengesteld uit verschillende celtypen. Tot op heden is een breed scala aan methoden ontwikkeld voor het genereren en analyseren van scRNA-seq-gegevens, en deze worden uitgebreid beschreven in andere uitstekende recensies 4,5,6,7 . Recente benchmarkstudies toonden ook aan dat scRNA-seq-protocollen aanzienlijk verschillen in hun vermogen om RNA vast te leggen, schaalbaarheid en kosteneffectiviteit 8,9.

Ondanks veel verbetering is eencellige omics mogelijk niet voldoende om cellulaire heterogeniteit te begrijpen. Hoewel differentiële expressieanalyse van scRNA-seq-gegevens genen kan identificeren die specifiek zijn voor celtypen en toestanden, zou het begrijpen van cellulaire identiteit eenvoudigweg uit een lijst van omhoog of omlaag gereguleerde genen een ontmoedigende taak zijn, omdat de functionele effecten van genen afhankelijk zijn van hun relaties. Genfuncties en de effecten van ziekte-geassocieerde varianten zijn grotendeels toe te schrijven aan de interactiepartners van deze genen in de gegeven cellulaire context 10,11. Vanuit een systeembiologisch perspectief zal netwerkmodellering van genen zeer nuttig zijn voor het begrijpen van functionele organisaties van belangrijke regulatoren die betrokken zijn bij operationele routes van elke celtoestand 12 . Netwerkbiologie heeft onze perceptie van een cel verschoven van een systeem dat voornamelijk bestaat uit de lineaire signaalroutes naar een systeem dat wordt ingenomen door vele zeer complexe verweven verbindingen tussen moleculen. Met name het genregulerende netwerk (GRN) is een intuïtief maar veelzijdig grafiekmodel voor functionele analyse dat het afgelopen decennium op grote schaal is gebruikt. GRN's hebben een belangrijke bijdrage geleverd aan het identificeren van biomarkers voor ziekten en therapeutische doelen en werden uiteindelijk gerealiseerd als een cruciaal hulpmiddel voor het ontcijferen van medische genomics-gegevens 13 . Het onderzoeken van de regulerende interacties tussen genen in verschillende biologische contexten zal waardevolle inzichten opleveren in hoe de opkomende functies van een bepaald levend systeem zijn ontworpen om te worden gereguleerd.

In dit overzichtsartikel introduceren we de definitie van eencellige netwerkbiologie en presenteren we de huidige methodologieën om GRN's af te leiden uit scRNA-seq-gegevens en te bepalen hoe ze ons begrip van regelgevende circuits voor cellulaire identiteit kunnen verbeteren en de praktijk van precisiegeneeskunde kunnen vergemakkelijken.


Materialen en methodes

Groeimedia en stammen

Bacteriën werden gekweekt in T-zouten minimaal medium aangevuld met glucose (0,2% w/v) plus 30 μM KH2PO4 voor chemostaten of 1 mM KH2PO4 voor batchcultuur (Spira et al. 1995). Bacteriën voor fenotypische tests werden gekweekt of minimaal medium A of L-bouillon (zoals beschreven door Miller [1972]). Alle groei was bij 37 o C. Voor lange termijn chemostaten werd MC4100TF een nacht gekweekt in T-zouten en geïnoculeerd in een 80 ml chemostaat die T-zouten, 0,2% glucose en 30 μM KH bevatte.2PO4 zoals beschreven (Spira en Ferenci 2008). De bacteriële concentratie in de chemostaat was gedurende 37 dagen stabiel, tussen 1,5 en 2,5 × 108 bacteriën/ml.

De in dit onderzoek gebruikte stammen worden beschreven in tabel 2 . De verschillende allelen van rpoS, hfq, en plek werden overgebracht van geëvolueerde stammen naar voorouderlijke stam of van voorouderlijke stam naar geëvolueerde stammen door P1-transductie zoals beschreven in Miller (1972). Voor de overdracht van de plek mutatie, zib563::Tn10 werd gebruikt als de gekoppelde selectiemarkering. Voor de overdracht van rpoS en hfq van geëvolueerde isolaten naar voorouderlijke stam of van voorouderlijke naar geëvolueerde isolaten, hebben we eerst geconstrueerd: cysD::amp en purA::tet stammen met behulp van het protocol beschreven in Yu en Court (1998). de nabijheid van cysD::Amp locus naar rpoS en purA::tet locus naar hfq toegestane cotransductie (㺐% cotransductie in beide gevallen). De transductanten werden getest op allelen door middel van sequencing.

Tafel 2

In de studie gebruikte stammen

stammenRelevant genotypeReferentie of Oorsprong
MC4100TFF-araD139 D(argF-lac)U169 rspL150 deoCl relA1 thiA ptsF25 flb5301 rbsRSpira et al. (2008)
BW4218Chemostaat geëvolueerd isolaatDeze studie
BW4223Chemostaat geëvolueerd isolaatDeze studie
BW4227Chemostaat geëvolueerd isolaatDeze studie
BW4236Chemostaat geëvolueerd isolaatDeze studie
BW3454MC4100TF metC162::Tn10Notley-McRobb en Ferenci (1999)
BW4239Chemostaat geëvolueerd isolaatDeze studie
BW5151DY330 purA:: Nee10Deze studie
BW5153MC4100TF purA:: Nee10Deze studie
BW5166MC4100 hfq4223Deze studie
BW6006BW4223 hfq4100Deze studie
BW5197BW4236 plek4100TFDeze studie
BW5199MC4100 plek4236Deze studie
BW5200MC4100TF zib563::Tn10Spira et al. (2008)
BW6007DY330 cysD::versterkerDeze studie
BW6008MC4100TF cysD::ampDeze studie
BW6009BW4218 cysD::versterkerDeze studie
BW6010BW4227 cysD::versterkerDeze studie
BW6011BW4239 cysD::versterkerDeze studie
BW6012MC4100 rpoS4218Deze studie
BW6013MC4100 rpoS4227Deze studie
BW6014MC4100 rpoS4239Deze studie
BW6015BW4218 rpoS4100Deze studie
BW6016BW4227 rpoS4100Deze studie
BW6017BW4239 rpoS4100Deze studie
DY330W3110 ΔlacU169 gal490 㮼l857 Δ(cro-bioA)Yu et al. (2000)

Detectie van rpoS Toestand

Het niveau van RpoS werd bepaald door glycogeen te kleuren met jodium. De intensiteit van de bruine kleur varieert afhankelijk van het niveau van σS in de cel (Notley-McRobb et al. 2002). Voor kwantificering werden foto's densitometrisch gescand over 2-μl gevlekte patches op L-agar met behulp van Image J-software en dichtheden gerelateerd aan voorouderwaarden. Voor blots werden bacterieculturen overnacht gekweekt in LB-medium bij 37 oC. Eiwitten van 2 - 109 cellen werden gescheiden door natriumdodecylsulfaat (SDS) -polyacrylamidegelelektroforese in een 12,5% gel en RpoS in blots gedetecteerd met verdunde monoklonale anti-RpoS-antilichamen (NeoClone). De Super Signal West Pico-kit (Pierce) werd gebruikt om de RpoS-banden te detecteren, zoals aanbevolen door de fabrikant. De signaalintensiteiten op autoradiogrammen werden gescand en berekend met behulp van de Image J-software. Er werden ten minste drie herhaalde kweken gebruikt en getest op statistische significantie.

Alkalische fosfatasetest

p-nitrofenylfosfaat (p-NPP) werd gebruikt als substraat zoals beschreven (Spira et al. 1995), en AP-activiteitseenheden worden gedefinieerd als de toename in absorptie bij 410 nm/min. Optische celdichtheid bij 600/nm.

SDS-gevoeligheidstest

De gevoeligheid voor SDS werd bepaald van overnachtkweken die in L-bouillon waren gekweekt door kweken (2 x) op L-agarplaten met 3% (w/v) SDS te spotten. Vloeibare kweken die 3% SDS bevatten, werden gevolgd door het meten van de absorptie van 6-voudige replica's van stammen in L-bouillon in microtiterplaten.

Methyl α-glucoside (α-MG)

Om de gevoeligheid voor α-MG te testen, werd kweek (2 μl) gespot op minimaal medium A 0,2% glycerolagarplaat met of zonder 1% α-MG. Voor kwantificering werden foto's densitometrisch gescand over de groeiplekken met behulp van Image J-software en dichtheden gerelateerd aan voorouderwaarden.

Groeiopbrengsten

De opbrengsten werden bepaald door de optische dichtheid van de kweken bij 600 nm te meten.

Biologische test

Het katabolisme van de uitgangsstam en de chemostaat isolaten met 95 substraten werden bepaald met behulp van de commercieel verkrijgbare Biolog GN2 (Biolog) zoals eerder beschreven (King et al. 2004).

Stressbestendigheidstesten

Bacteriën uit overnachtkweken in L-bouillon werden twee keer gewassen en verdund in 0,9% NaCl tot een dichtheid van 103 cellen/ml. Voor oxidatieve stress, vers verdund H2O2 werd toegevoegd aan 1 ml kweek tot eindconcentraties van 1, 2, 3, 4 en 5 mM en 30 minuten op kamertemperatuur gehouden. Voor osmolariteit werden suspensies van 4 tot 103 cellen/ml gedurende 1 uur bij kamertemperatuur geïncubeerd in 1, 2, 3, 4, 5 M NaCl.

Pi-opnametest

Voor transportassays werden 500 μl bacteriën van 30-uur oude Pi-gelimiteerde chemostaatculturen gemengd met 5 μl van 100 μM KH2PO4 en 10 μl van 1㯌i 32 P/μl (MP Biomedicals). Monsters (100 μl) genomen op tijdstippen werden gefilterd door poriegrootte 0,45-μm filters, onmiddellijk gewassen met 5 ml wasoplossing (T-zout plus 100 μM KH2PO4). De opnamesnelheden werden bepaald door de scintillatie van 32P in de 5 - 107 cellen op de filters te meten.

PpGpp-test

Cellen die exponentieel groeien in T-zouten/glucose werden aangevuld met en 0,25 mM 32 P-KH2PO4 (100 㯌i/ml) bij een OD600 = 0,2. Monsters werden geoogst na 70, 80 en 90 minuten. De gelabelde monsters werden geanalyseerd zoals in Spira et al. (2008).

Fitnessexperimenten in chemostaten

Voor fitnessvergelijkingen: een tetracycline-resistent derivaat van MC4100TF met a leerde kennenC::TnlO-insertie werd gebruikt en medium werd aangevuld met 4 pg/ml methionine. Chemostaatcompetities waren zoals eerder beschreven (Maharjan et al. 2006) en de selectiecoëfficiënten waren gebaseerd op de vergelijkingen in Dykhuizen en Hartl (1983).

Proteomics en genomics details en strategieën worden beschreven in de aanvullende tabellen S1 en S2 (aanvullend materiaal online) en bijbehorende legendes.


Bekijk de video: STSN Symposium 2016 Eleonora Aronica (September 2022).


Opmerkingen:

  1. Ariel

    het denkbeeldige :)

  2. Benroy

    Het is het daarmee eens, deze vermakelijke mening

  3. Wulf

    Absoluut met je eens. It seems to me an excellent idea. Ik ben het met je eens.

  4. Zulkir

    Je realiseert je, dat je vertelt ...



Schrijf een bericht