Informatie

DNA superponeren

DNA superponeren


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ik heb een reeks eiwitmodellen met DNA gekoppeld. Ik wil nu het DNA superponeren op een referentie-DNA-molecuul en de toegepaste translatieafstand en de gebruikte rotatiehoek extraheren.

Ik kan DNA-moleculen superponeren met Chimera, maar ik kan de translatie-afstand en de rotatiehoek niet extraheren die werd toegepast om te superponeren.

Ik heb ook naar MODELLER gekeken, maar het lijkt erop dat MODELLER DNA niet kan superponeren.

Kent iemand software/code waarmee ik de gewenste informatie kan extraheren?


Probeer dit eens met BioPython:

van Bio.PDB.PDBSuperimposer importeer PDBSuperimposer als superimposer van Bio.PDB.PDBParser importeer PDBParser parser = PDBParser() sup = superimposer() struct_1 = parser.get_structure("XXXX","first_pdb") structget_2 = parser.XXX. ","second_pdb") atoms1 = struct_1.get_atoms() atoms2 = struct_2.get_atoms() sup.set_atoms(atoms1,atoms2) print sup.rotrans #print de rotatie-translatiematrix van de SVD #dan om de uitlijning te voltooien sup.apply ()

U kunt hier kijken voor meer details. SuperPoser


Structurele basis voor het herstellen van sequentiespecifieke DNA-binding en transactivatie aan mutant p53 door suppressormutaties ☆

Het tumorsuppressoreiwit p53 is gemuteerd in meer dan 50% van de invasieve kankers. Ongeveer 30% van de mutaties wordt gevonden in zes belangrijke "hot spot"-codons die zich in het DNA-bindende kerndomein ervan bevinden. Om structureel inzicht te krijgen in de schadelijke effecten van dergelijke mutaties en hun redding door suppressormutaties, hebben we de kristalstructuren van het p53-kerndomein bepaald met de hotspot-mutatie R249S, het kerndomein met R249S en een tweede-site suppressormutatie H168R (verwezen als de dubbele mutant R249S/H168R) en zijn sequentiespecifieke complex met DNA en van de drievoudige mutant R249S/H168R/T123A. De structurele studies gingen gepaard met transactivatie- en apoptose-experimenten. De kristalstructuren laten zien dat het gebied in de buurt van de mutatieplaats in de R249S-mutant een reeks conformaties vertoont [wild-type (wt) en verschillende mutant-type conformaties] als gevolg van het verlies van stabiliserende interacties gemedieerd door R249 in de wt eiwit. Als gevolg hiervan is het eiwitoppervlak dat cruciaal is voor de vorming van functionele p53-DNA-complexen, door eiwit-eiwit- en eiwit-DNA-interacties, grotendeels vervormd in de mutante conformaties, waardoor het "verlies van functie" van het eiwit wordt verklaard als een transcriptiefactor. De structuur van dit gebied wordt hersteld in zowel R249S/H168R als R249S/H168R/T123A en wordt verder gestabiliseerd in het complex van R249S/H168R met DNA. Onze functionele gegevens laten zien dat de introductie van H168R als een suppressormutatie op de tweede plaats de transactiveringscapaciteit van het eiwit gedeeltelijk herstelt en dat dit effect verder wordt versterkt door de toevoeging van een mutatie op de derde plaats T123A. Deze bevindingen, samen met eerder gerapporteerde gegevens over wt en mutant p53, bieden een structureel raamwerk voor het begrijpen van p53-disfunctie als gevolg van oncogene mutaties en de redding ervan door suppressormutaties en voor een mogelijk geneesmiddelontwerp dat gericht is op het herstellen van wt-activiteit op afwijkende p53-eiwitten.


DNA superponeren - biologie

Alle door MDPI gepubliceerde artikelen worden direct wereldwijd beschikbaar gesteld onder een open access licentie. Er is geen speciale toestemming nodig om het door MDPI gepubliceerde artikel geheel of gedeeltelijk te hergebruiken, inclusief figuren en tabellen. Voor artikelen die zijn gepubliceerd onder een open access Creative Common CC BY-licentie, mag elk deel van het artikel zonder toestemming worden hergebruikt, op voorwaarde dat het originele artikel duidelijk wordt geciteerd.

Feature Papers vertegenwoordigen het meest geavanceerde onderzoek met een aanzienlijk potentieel voor grote impact in het veld. Feature Papers worden ingediend op individuele uitnodiging of aanbeveling door de wetenschappelijke redacteuren en ondergaan peer review voorafgaand aan publicatie.

De Feature Paper kan ofwel een origineel onderzoeksartikel zijn, een substantiële nieuwe onderzoeksstudie waarbij vaak verschillende technieken of benaderingen betrokken zijn, of een uitgebreid overzichtsdocument met beknopte en nauwkeurige updates over de laatste vooruitgang in het veld dat systematisch de meest opwindende vooruitgang in de wetenschappelijke literatuur. Dit type paper geeft een blik op toekomstige onderzoeksrichtingen of mogelijke toepassingen.

Editor's Choice-artikelen zijn gebaseerd op aanbevelingen van de wetenschappelijke redacteuren van MDPI-tijdschriften van over de hele wereld. Redacteuren selecteren een klein aantal artikelen die recentelijk in het tijdschrift zijn gepubliceerd en waarvan zij denken dat ze bijzonder interessant zijn voor auteurs, of belangrijk zijn op dit gebied. Het doel is om een ​​momentopname te geven van enkele van de meest opwindende werken die in de verschillende onderzoeksgebieden van het tijdschrift zijn gepubliceerd.


Discussie

De fundamentele vooruitgang van DNA-microscopie is het fysiek afbeelden van biologische monsters met behulp van een ongestructureerde en op zichzelf staande chemische reactie. Dit maakt het een aparte microscopische beeldvormingsmodaliteit op zich. Als technologie hebben we een nauwe parallel getrokken tussen DNA-microscopie en optische superresolutie: beide profiteren van de stochastische fysica om de meetonzekerheid te verminderen tot voorbij wat oppervlakkig gezien een door de fysica opgelegde limiet is.

De twee verschillen echter op verschillende fundamentele manieren. Optische superresolutiemicroscopie is gebaseerd op de kwantummechanica van verval van fluorescentie-energie. DNA-microscopie is echter volledig afhankelijk van thermodynamische entropie. Op het moment dat we biomoleculen taggen met UMI's in het DNA-microscopieprotocol, krijgt het monster ruimtelijk gestratificeerde en chemisch te onderscheiden DNA-puntbronnen. Dit proces introduceert daardoor een ruimtelijke chemische gradiënt over het monster die voorheen niet bestond. Zodra deze puntbronnen door PCR beginnen te versterken en diffunderen, begint deze ruimtelijke gradiënt te verdwijnen. Deze entropische homogenisatie van het monster is wat verschillende UMI-diffusiewolken ertoe aanzet om te interageren en UEI's te vormen. Het is daarom deze toename van de entropie van het systeem die de DNA-microscopiereactie het meest direct aandrijft om betekenisvolle informatie over een monster vast te leggen.

Een belangrijk zwak punt voor DNA-microscopie blijft de resolutie van lege ruimte, en toekomstig werk zal nodig zijn om dit obstakel te elimineren om hoogwaardige reconstructies van monsters te produceren over grote lengtes waar er gaten zijn. Het is mogelijk dat een op "landmark" gebaseerde benadering, waarbij specifieke DNA-sequenties worden gedeponeerd op bekende fysieke locaties om te helpen bij het beeldreconstructieproces, uiteindelijk de meest kosteneffectieve manier zal blijken om dit te bereiken. Betere analytische technieken om te corrigeren voor grote schaalverstoringen kunnen even effectief blijken te zijn, zonder het experiment zelf te compliceren. Het feit dat DNA-microscopie volledig met een pipet wordt uitgevoerd, betekent echter dat er gemakkelijk grote aantallen monsters tegelijk kunnen worden verwerkt. De technologie is daarom structureel bevorderlijk voor een enorme doorvoer.

DNA-microscopie biedt een nieuwe vorm van opticavrije beeldvorming die gebruikmaakt van de grote schaalvoordelen bij DNA-sequencing. De technologie vereist geen opoffering van ruimtelijke resolutie voor sequentienauwkeurigheid, omdat deze profiteert in plaats van te lijden van een hoge signaaldichtheid en niet afhankelijk is van optische resolutie van diffractie-beperkte "spots" ter plaatse. Door chemie zelf te gebruiken als middel voor beeldacquisitie, ontkoppelt DNA-microscopie de ruimtelijke resolutie van de penetratiediepte van het specimen (anders verbonden door de eigenschappen van elektromagnetische straling) en omzeilt daardoor een afweging die wordt opgelegd door de fysica van golfvoortplanting.

Ten slotte, omdat het niet afhankelijk is van gespecialiseerde apparatuur en kan worden uitgevoerd in een formaat met meerdere putjes met normale laboratoriumpipetten, is DNA-microscopie zeer schaalbaar. Het is volledig multiplex-compatibel (beeldvorming van elke PCR-sjabloon) en gebruikt sequencing-diepte als een wijzerplaat om ruimtelijke en genetische details te verbeteren. Omdat DNA-microscopie bovendien single-nucleotide variatie in biologische DNA- of RNA-sequenties uitleest, lost het ruimtelijk de astronomisch grote potentiële variatie op die bestaat in somatische mutaties, stochastische RNA-splitsing, RNA-editing en vergelijkbare vormen van genetische diversiteit in celpopulaties . We hebben aangetoond dat het dit met hoge nauwkeurigheid bereikt over lange leeslengtes.

Onze ontwikkeling van een chemisch gecodeerd microscopiesysteem laat zowel fundamentele theoretische als experimentele vragen open. Enerzijds zullen toekomstige experimentele en computationele verbeteringen helpen om grote lengteschalen met ruimtelijke lacunes beter op te lossen. Aan de andere kant heeft de UEI, door in deze experimenten effectief te functioneren als een DNA-analoog van het foton, een bredere potentiële rol voor DNA als medium voor kunstmatige biologische opnames belicht. Het meest direct kan DNA-microscopie in principe buiten het transcriptoom worden toegepast, bijvoorbeeld direct op DNA-sequenties of op eiwitten die zijn gedetecteerd met DNA-gelabelde antilichamen. Kijkend naar de toekomst, kan een volledige verkenning van individuele en idiosyncratische ruimtelijke structuren in de biologische wereld door ze te coderen in DNA-basen, in plaats van fotonische pixels, nieuwe informatielagen onthullen die anders verborgen zouden blijven door de grenzen van optische en elektronengebaseerde beeldvorming.


RESULTATEN EN DISCUSSIE

Voordat we de ionenverdelingen rond de AGCT- en ATGC-oligomeren bespreken, kunnen we ons eerst afvragen of het gebruik van het CHC-systeem inderdaad nuttig is. Om dit te testen gebruiken we als voorbeeld de bij het AGCT-oligomeer behorende fosforatomen.

We beginnen met het opnemen van de positie van elk van deze atomen van elke momentopname van 1 ps langs het traject van 1 μs, met behulp van de kromlijnige helicoïdale coördinaten die zijn gedefinieerd in de sectie methodologie. Elk fosforatoom wordt beschreven door zijn radiale R, longitudinaal NS en hoekig EEN coördinaten (zie figuur 1). Dit houdt in dat de meest significante algemene fluctuaties van het oligomeer (uitrekken, draaien en buigen) geen invloed zullen hebben op de helicoïdale coördinaten die de samenstellende atomen beschrijven. Om dit te testen genereren we eerst een gemiddelde DNA-structuur uit het traject. Vervolgens berekenen we de spiraalvormige as met Curves+ ( 37) en gebruiken deze om de momentane spiraalvormige coördinaten van de fosforatomen van elke momentopname om te zetten in een algemeen Cartesiaans coördinatensysteem. De verstrooiing in de posities van elk fosforatoom kan vervolgens worden gebruikt om de isodensiteitsoppervlakken te genereren die rechts in figuur 1 worden getoond (uitgezet met Chimera (39, 40)). Meer kwantitatief kunnen we root mean square fluctuaties (RMSF) voor elk fosforatoom berekenen en de waarden vergelijken met die verkregen door simpelweg de Cartesiaanse coördinaten van elke snapshot te superponeren. De resultaten in figuur 2 laten zien dat de CHC-methode in bijna alle gevallen leidt tot kleinere RMSF-waarden. Deze vermindering is met name interessant in het midden van elke streng, waar niet verwacht werd dat de algehele fluctuaties van het oligomeer een significant effect zouden hebben.

Wortelgemiddelde kwadratische fluctuaties (Å) voor de fosforatomen van het AGCT-oligomeer zijn kleiner wanneer ze worden berekend met behulp van de CHC-analyse die is toegewezen aan de cartesiaanse ruimte (zwarte lijnen), dan wanneer eenvoudig snapshots van de moleculaire dynamica-simulatie (rode lijnen) worden gesuperponeerd. Merk op dat fosfaten die tot de twee strengen behoren achtereenvolgens in de 5'-3'-richting worden weergegeven.

Wortelgemiddelde kwadratische fluctuaties (Å) voor de fosforatomen van het AGCT-oligomeer zijn kleiner wanneer ze worden berekend met behulp van de CHC-analyse die is toegewezen aan de cartesiaanse ruimte (zwarte lijnen), dan wanneer eenvoudig snapshots van de moleculaire dynamica-simulatie (rode lijnen) worden gesuperponeerd. Merk op dat fosfaten die tot de twee strengen behoren achtereenvolgens in de 5'-3'-richting worden weergegeven.

Het analyseren van de positie van DNA-atomen in helicoïdale coördinaten is ook nuttig voor het verschaffen van referentieposities om te helpen bij het analyseren van ionenverdelingen. Dit wordt geïllustreerd in figuur 3, waar we de fosforverdelingen in de spiraalvormige coördinatenruimte plotten met behulp van de drie mogelijke 2D-plots: DA (linksboven), DR (rechtsboven) en RA (linksonder). De DA plot (verkregen door de fosfordichtheid over alle radiale afstanden op te tellen R) toont een 'uitgepakt' en 'afgewikkeld' beeld van het oligomeer. De fosfaatdichtheden van elke streng leiden bijgevolg tot een kolom van distributies bij constante EEN waarden, waarbij de kleinere scheiding tussen de twee kolommen overeenkomt met de kleine groef van de dubbele helix. In de DR plot (verkregen door optellen over alle hoeken EEN), alle fosforatomen liggen op een constante afstand (R = 10,25 Å) van de spiraalvormige as. Deze afstand kan worden gebruikt om een ​​bruikbare straal te definiëren die de schroeflijnvormige groeven begrenst, zoals weergegeven door de witte cirkel in de RA plot (verkregen door optellen over alle axiale afstanden NS). Hier worden alle fosforatoomverdelingen gesuperponeerd en volgen ze nauwgezet de R = 10,25 Å straalcirkel.

Gemiddelde fosforverdelingen berekend met CHC voor het 1 μs AGCT-traject en uitgezet in verschillende vlakken: DA (linksboven), DR (rechtsboven), RA (linksonder). De plot rechtsonder toont de RA vlak voor de suiker C1′-atomen uit hetzelfde traject. De blauwe tot rode kleurenschaal staat voor toenemende molariteit. DR en RA grafieken tonen de gemiddelde straal van de fosforatomen vanaf de spiraalvormige as als respectievelijk een witte lijn en een witte cirkel. De DA en RA grafieken tonen de kleine groeflimieten, gedefinieerd door de gemiddelde C1′-posities, respectievelijk als een witte lijn en als witte radiale vectoren. RA plots hebben ook een verticale radiale vector die het midden van de hoofdgroef aangeeft.

Gemiddelde fosforverdelingen berekend met CHC voor het 1 μs AGCT-traject en uitgezet in verschillende vlakken: DA (linksboven), DR (rechtsboven), RA (linksonder). De plot rechtsonder toont de RA vlak voor de suiker C1′-atomen uit hetzelfde traject. De blauwe tot rode kleurenschaal staat voor toenemende molariteit. DR en RA grafieken tonen de gemiddelde straal van de fosforatomen vanaf de spiraalvormige as als respectievelijk een witte lijn en een witte cirkel. De DA en RA grafieken tonen de kleine groeflimieten, gedefinieerd door de gemiddelde C1′-posities, respectievelijk als een witte lijn en als witte radiale vectoren. RA plots hebben ook een verticale radiale vector die het midden van de hoofdgroef aangeeft.

Figuur 3 bevat nog een plot (rechtsonder) die overeenkomt met een RA analyse van de suiker C1′-atomen. Deze atomen vormen een nuttige gids voor de positie van de kleine groef, omdat ze de positie van de glycosidische bindingen weerspiegelen. Merk op dat de C1′-dichtheden strakker zijn dan die van de fosforatomen, omdat ze minder worden beïnvloed door backbone-fluctuaties, maar ook omdat ze, omdat ze dichter bij de spiraalvormige as zijn, minder worden beïnvloed door de B-DNA-helix in de helicoïdale coördinaatruimte (een effect dat beter zichtbaar is voor de verder verwijderde fosforatomen in de DA en RA percelen). Door radiale vectoren door het midden van de C1′-verdelingen te trekken, kunnen we de kleine groef definiëren als tussen EEN waarden van 33° en 147°. We nemen de resterende waarden van EEN om tot de grote groef te behoren, omdat we regio's niet specifiek toeschrijven aan de fosfodiëster-ruggengraat. We voltooien het visuele referentiesysteem in RA grafieken door een lijn toe te voegen langs de externe bissectrice van de C1′-vectoren om het midden van de grote groef aan te geven. Merk op dat de C1′-vectoren ook kunnen worden gebruikt om de kleine groefpositie in 1D . te tonen EEN plots (waar ze verticale lijnen worden) en op dezelfde manier kan de fosforstraal worden toegevoegd als een verticale lijn in 1D R percelen (zie hieronder).

We moeten opmerken dat het nut van de CHC-benadering afhangt van het hebben van een goed gedefinieerde spiraalvormige as. Curves+ berekent een kromlijnige as die loopt tussen de terminale basenparen van het oligomeer. Als er echter significante eindrafeling optreedt, kan dit leiden tot verstoringen van de as, die vervolgens worden weerspiegeld in de helicoïdale coördinaten die worden gebruikt om atomaire (of ionische) posities te beschrijven. Bovendien wordt de positie van ionen voorbij de uiteinden van de spiraalvormige as niet geregistreerd.

Voordat we verder gaan met de analyse van ionenverdelingen rond DNA, moeten we nadenken over de kwestie van convergentie. Zoals hieronder getoond, komen de belangrijkste ionendichtheden voor in de DNA-groeven (R ≤ 10.25 Å) en tussen opeenvolgende basenparen (hier gedefinieerd als N − 0.2 ≤ NSN + 1.2 voor een basenpaarstap NPN + 1). We hebben daarom convergentie getest door te kijken naar de gemiddelde kaliumionpopulaties als functie van de tijd voor unieke basenpaarstappen die behoren tot het centrale tetranucleotide en in de bijbehorende grote of kleine groeven. De resultaten voor het AGCT-oligomeer worden getoond in figuur 4 en de overeenkomstige gegevens voor ATGC in aanvullende figuur S4. Beide figuren laten zien dat er minimaal 300 ns simulatie nodig is om stabiele ionenpopulaties te bereiken (en in sommige gevallen kunnen niet-verwaarloosbare veranderingen optreden tot 500 ns).

Tijdgemiddelde K+-populaties binnen de DNA-groeven voor de unieke basenpaarstappen (T8pA9, A9pG10, G10pC11) die behoren tot het centrale tetranucleotide van het AGCT-oligomeer voor toenemende duur (ns) van het moleculaire dynamische traject.

Tijdgemiddelde K+-populaties binnen de DNA-groeven voor de unieke basenpaarstappen (T8pA9, A9pG10, G10pC11) die behoren tot het centrale tetranucleotide van het AGCT-oligomeer voor toenemende duur (ns) van het moleculaire dynamische traject.

Een tweede convergentietest wordt getoond in figuur 5, waar we eenvoudig gemiddelde Cartesiaanse coördinaten voor het AGCT-oligomeer hebben gegenereerd met behulp van momentopnamen van 1 ps en inclusief de positie van alle K + (blauw) en Cl − (groen) ionen. Wanneer het gemiddelde wordt gemaakt over een simulatie van enkele tientallen nanoseconden, hebben de ionen de neiging om beperkte volumes van de simulatiecel (15) te bemonsteren en zijn ze dus duidelijk te onderscheiden. Na 1 μs simulatie vallen de gemiddelde ionenposities echter allemaal samen bij de oorsprong van de simulatiecel, wat aantoont dat ze de tijd hebben gehad om de volledige simulatiecel op een gelijkwaardige manier grondig te bemonsteren, waarbij wordt voldaan aan het principe van ergodiciteit.

Gemiddelde conformatie van het AGCT-oligomeer (zwarte lijntekening) en de bijbehorende gemiddelde locaties van de K + (blauwe bollen) en Cl − (groene bollen) -ionen berekend voor toenemende duur van het moleculaire dynamische traject.

Gemiddelde conformatie van het AGCT-oligomeer (zwarte lijntekening) en de bijbehorende gemiddelde locaties van de K + (blauwe bollen) en Cl − (groene bollen) -ionen berekend voor toenemende duur van het moleculaire dynamische traject.

Nadat we hebben aangetoond dat redelijke convergentie is bereikt, gaan we over tot een algemene analyse van de kaliumionverdelingen rond het AGCT-oligomeer. We beginnen met 1D R, NS en EEN grafieken getoond in figuur 6. De radiale afstand R plot, dat ook een radiale distributiefunctie is, toont twee pieken binnen de groeven en één buiten de straal van het fosforatoom (aangegeven door de verticale lijn). Merk op dat de maximale molariteit voor de piek die zich het dichtst bij de spiraalvormige as bevindt bijna 14 keer de bulkwaarde bereikt, terwijl bij 30 Å de waarde iets lager is dan de effectieve bulkmolariteit (0,336 M, rekening houdend met de extra K + -ionen toegevoegd aan neutraliteit bereiken). De asafstand: NS plot toont twee interessante kenmerken: ten eerste drie herhaalde profielen die in overeenstemming zijn met de herhalende basensequentie en die sterke molariteitspieken vertonen bij drie opeenvolgende GpC-stappen ten tweede een afname in ionendichtheid naar de uiteinden van het oligomeer, als gevolg van de afnemende fosfaatdichtheid ( 41). Ten slotte, de hoekige EEN grafiek laat zien dat kaliumionendichtheidspieken voorkomen in beide groeven.

1D K + -verdelingen gemiddeld over het 1 μs AGCT-traject. De verticale lijn in de R grafiek geeft de radiale positie van de fosforatomen aan, terwijl de kortere afstand tussen de twee verticale lijnen in de EEN plot begrenst de kleine groef met behulp van de hoekpositie van de suiker C1′-atomen (zie figuur 3).

1D K + -verdelingen gemiddeld over het 1 μs AGCT-traject. De verticale lijn in de R grafiek geeft de radiale positie van de fosforatomen aan, terwijl de kortere afstand tussen de twee verticale lijnen in de EEN plot begrenst de kleine groef met behulp van de hoekpositie van de suiker C1′-atomen (zie figuur 3).

We kunnen deze analyse verder verfijnen door over te gaan op 2D-representaties. Figuur 7 toont de DA en RA plots voor kaliumionen, opnieuw rond het AGCT-oligomeer (met radiale bemonstering beperkt tot 15 Å). Dit stelt ons in staat om de R piek die zich het dichtst bij de spiraalvormige as bevindt (te zien in figuur 6) als ionenbinding in het midden van de hoofdgroef, terwijl er aan de kant van de kleine groef een meer diffuse dichtheid is met twee maxima (zie de DA en RA percelen). Alvorens de details van de kaliumionenverdelingen in te vullen, is het de moeite waard om deze resultaten te vergelijken met die voor de chlooranionen. Aanvullende figuur S5 laat zien dat chlooranionen bijna geen dichtheid hebben binnen de fosforstraal, hoewel ze beginnen te penetreren wanneer de fosfaatdichtheid afneemt naar de uiteinden van het oligomeer (zie de DR verhaal). Zoals verwacht vindt deze penetratie voornamelijk plaats aan de kant van de bredere hoofdgroef (zie de RA verhaal).

2D K + -verdelingen gemiddeld over het 1 μs AGCT-traject: DA vliegtuig (linksboven), DR vliegtuig (rechtsboven), RA vlak (onder). De resultaten zijn uitgezet als molariteiten zoals weergegeven door de kleurenbalken, met een blauwe tot rode schaal die toenemende waarden aangeeft.

2D K + -verdelingen gemiddeld over het 1 μs AGCT-traject: DA vliegtuig (linksboven), DR vliegtuig (rechtsboven), RA vlak (onder). De resultaten zijn uitgezet als molariteiten zoals weergegeven door de kleurenbalken, met een blauwe tot rode schaal die toenemende waarden aangeeft.

Om de analyse van kaliumionen te voltooien, is het nuttig om te kijken naar de 3D-ionenverdelingen die zijn gereconstrueerd op basis van de momentane helicoïdale coördinaten met behulp van een enkele, gemiddelde spiraalvormige as (zoals voor de RMSF-berekeningen in figuur 2). Deze verdelingen worden weergegeven als isodensiteitsgrafieken in figuur 8. De linkerafbeelding toont de gemiddelde DNA-conformatie als een draaddiagram met K + -ionenverdelingen op twee isodensiteitsniveaus: 15 M (rode vaste volumes) en 5 M (groene mesh). De rechterafbeelding toont dezelfde isodensiteiten, maar met een oppervlakteaanzicht van DNA dat helpt bij het lokaliseren van de ionen in de grote en kleine groeven. Zoals al te zien is in figuur 4, komen de grootste ionendichtheden voor in de hoofdgroef van de GpC-stappen, terwijl de grootste kleine groefdichtheden optreden bij TpA-stappen.

3D K + -verdelingen verkregen door CHC-analyse van het 1 μs AGCT-traject in de cartesiaanse ruimte in kaart te brengen met betrekking tot de gemiddelde DNA-structuur, weergegeven als een lijntekening aan de linkerkant (G: blauw, C: groen, A: rood, T: oranje ) en als een grijs, voor oplosmiddelen toegankelijk oppervlak aan de rechterkant. Molariteit isodensiteit oppervlakken voor kaliumionen zijn uitgezet op 15 M (vast rood) en 5 M (groen gaas).

3D K + -verdelingen verkregen door CHC-analyse van het 1 μs AGCT-traject in de cartesiaanse ruimte in kaart te brengen met betrekking tot de gemiddelde DNA-structuur, weergegeven als een lijntekening aan de linkerkant (G: blauw, C: groen, A: rood, T: oranje ) en als een grijs, voor oplosmiddelen toegankelijk oppervlak aan de rechterkant. Molariteit isodensiteit oppervlakken voor kaliumionen zijn uitgezet op 15 M (vast rood) en 5 M (groen gaas).

In dit stadium is het nuttig om het AGCT-oligomeer te vergelijken met de resultaten die zijn verkregen voor de ATGC-sequentie. Hoewel het laatste oligomeer een vergelijkbare algemene B-DNA-structuur heeft en dezelfde 50/50-balans van AT- en GC-basenparen, is de ionenverdeling nogal anders, zoals blijkt uit de 3D-afbeeldingen in aanvullende figuur S6. Het gebruik van dezelfde isodensiteitsoppervlakken als figuur 8 maakt duidelijk dat lokale K+-dichtheden kleinere volumes in beide groeven innemen. In de grote groef zijn ze opnieuw gelokaliseerd op GpC, terwijl in de kleine groef de dichtheden aanzienlijk zwakker zijn en geassocieerd met ApT-stappen.

Met behulp van de 3D-informatie kunnen we nu terugkeren naar 2D RA plots voor een gedetailleerde en kwantitatieve analyse voor individuele basenpaarstappen en voor elke groef. Figuur 9 toont de resultaten voor unieke basenpaarstappen van het centrale tetranucleotide van elk oligomeer: ​​TpA, ApG en GpC voor het AGCT-oligomeer en ApT, TpG en GpC voor het ATGC-oligomeer. In elk geval worden de gemiddelde ionenpopulaties binnen de groeven weergegeven (overeenkomend met de gegevens die al zijn uitgezet in figuur 4). Het is opvallend dat in GpC-stappen in het AGCT-oligomeer kaliumionen bijna 80% van de tijd sterk gelokaliseerd zijn in hun belangrijkste groeven. Deze waarde neemt iets af, maar overschrijdt nog steeds 60% voor dezelfde stap in het ATGC-oligomeer. Deze belangrijkste ionbindingsplaatsen leiden tot lokale molariteiten van meer dan 50 M, bijna 150 keer hoger dan de bulkconcentraties van kaliumionen. Secundaire ionenbindingsplaatsen, die ongeveer 25-35% van de tijd in beslag nemen, komen voor in de kleine groef van TpA-stappen en de hoofdgroef van ApG-stappen voor AGCT, en ook in de hoofdgroeven van ApT- en TpG-stappen voor ATGC.

2D RA K+-verdelingen voor verschillende dinucleotide-stappen binnen de centrale tetranucleotiden van de AGCT- en ATGC-oligomeren, gemiddeld over de overeenkomstige 1 s-trajecten. De blauwe tot rode kleurenschaal geeft toenemende molariteitswaarden aan. In elk perceel geven de getallen in de bovenste en onderste halve cirkels de gemiddelde K+-bezetting in respectievelijk de grote en kleine groeven aan.

2D RA K+-verdelingen voor verschillende dinucleotide-stappen binnen de centrale tetranucleotiden van de AGCT- en ATGC-oligomeren, gemiddeld over de overeenkomstige 1 s-trajecten. De blauwe tot rode kleurenschaal geeft toenemende molariteitswaarden aan. In elk perceel geven de getallen in de bovenste en onderste halve cirkels de gemiddelde K+-bezetting in respectievelijk de grote en kleine groeven aan.

Ten slotte beschouwen we de vraag of kationbinding in de groeven van DNA gerelateerd is aan fluctuaties in groefbreedte. Deze vraag is het onderwerp geweest van uitgebreide discussies (1, 4, 12, 15, 20), waarbij werd gesteld dat gebonden kationen in staat zouden moeten zijn om fosfaatafstoting tegen te gaan en tot groefvernauwing te leiden. Conclusies waren echter onduidelijk, deels omdat het moeilijk was om te definiëren wat 'binnen de groeven zijn' vanuit geometrisch oogpunt betekende. We kunnen deze vraag nu opnieuw bekijken in het licht van de CHC-ionenanalyse. Hiervoor hebben we de groefbreedtevariaties toegevoegd aan de 1D-asafstand NS plots van K + ionendichtheid, waarbij de sommatie over R is nu beperkt tot de groeven (R = 0–10,25 Å) en de optelling van de hoeken EEN is beperkt tot de kleine of grote groove. Figuur 10 toont de resultaten voor AGCT-oligomeer. Voor dit geval is er een duidelijke oscillatie van beide groefbreedten (stippellijnen), in register met de tetranucleotide herhalende sequentie. Deze oscillatie houdt verband met pieken in de ionendichtheid, maar merk op dat de groeven breed zijn wanneer de ionendichtheid in de groeven hoog is. Deze bevindingen zijn in tegenspraak met een argument gebaseerd op groefvernauwing als gevolg van de compensatie van fosfaatafstoting. In het ATGC-oligomeer (zie aanvullende figuur S7) variëren de groefbreedten aanzienlijk minder langs de sequentie (anders dan aan de uiteinden van het oligomeer), maar nogmaals, er is geen indicatie dat ionbinding leidt tot groefvernauwing. Het bevestigen van deze bevindingen vereist echter de studie van een breder scala aan basensequenties.

Variaties in K+-molariteit langs de DNA-groeven (ononderbroken lijnen) van het AGCT-oligomeer. Waarden worden gemiddeld over het 1 μs AGCT-traject en vergeleken met variaties in groefbreedte (stippellijnen). Groefbreedtevariaties zijn uitgezet in Å ten opzichte van de respectieve minimale waarden (groot: 10,0 Å, klein: 3,5 ) op dezelfde schaal als de molariteiten. Links: grote groef. Rechts: kleine groef.

Variaties in K+-molariteit langs de DNA-groeven (ononderbroken lijnen) van het AGCT-oligomeer. Waarden worden gemiddeld over het 1 μs AGCT-traject en vergeleken met variaties in groefbreedte (stippellijnen). Groefbreedtevariaties zijn uitgezet in Å ten opzichte van de respectieve minimale waarden (groot: 10,0 Å, klein: 3,5 Å) op dezelfde schaal als de molariteiten. Links: grote groef. Rechts: kleine groef.


CONCLUSIE

Het buigen van een paar nucleotidesegmenten van een macromoleculaire keten als een dunne stijve staaf van de elasticiteitstheorie is een van de eenvoudigste conceptuele modellen om DNA- of RNA-macromoleculen in haarspelden te vouwen. Met dit eenvoudige idee hebben we aangetoond dat enkelstrengs B-DNA kan worden vervormd tot haarspeldlussen die niet alleen overeenkomen met alle gepubliceerde NMR-gegevens die beschikbaar zijn voor trinucleotide TTT-lussen (5), maar ook met de PDB-structuren van tri- en tetra-lussen van DNA. We hebben bovendien aangetoond dat enkelstrengs A‐RNA kan worden vervormd met dezelfde vouwmethode tot UUCG-tetraloops. Merk op dat de vormen van DNA- en RNA-haarspelden verschillend zijn, maar goed worden gereproduceerd door dezelfde methodologie die wordt toegepast met de verschillende eindvoorwaarden die worden opgelegd door B-DNA- of A-RNA-helixgeometrieën. Deze resultaten lijken aan te tonen dat elastische eigenschappen van de suiker-fosfaatketens een sleutelrol spelen om de vouwvormen van zowel DNA als RNA in haarspelden te begrijpen. Tot nu toe zijn verschillende soorten interacties aangevoerd om de opmerkelijke stabiliteit van alle bestudeerde haarspelden te verklaren: specifieke waterstofbinding, stapeling en hydrofobe interacties. De suiker-fosfaatketens lijken te vouwen langs de meest vloeiende lijnen met de minste vervormingsenergie (gegeven door de elasticiteitstheorie) en de meeste torsiehoeken blijven dicht bij hun oorspronkelijke waarden (B-DNA of A-RNA). Het suggereert dat, voor deze moleculen, de elastische eigenschappen van suiker-fosfaatketens een belangrijke structurele en energetische bijdrage zijn aan het vouwen van haarspeldjes die hun buitengewone stabiliteit kunnen verklaren.

Volgens de gebruikelijke beschrijvingen zijn haarspelden dubbele spiraalvormige base-gepaarde stengels die worden afgedekt door een lussequentie van ongepaarde of niet-overeenkomende nucleotiden. In de voorgestelde opvatting moeten deze vreemde mismatches (G·A in tetra‐ en tri‐loops, A·A in triloop AAA of U·G in UUCG) eerder worden beschouwd als zeer goede basenparen die voldoen aan de geometrische vereisten die worden opgelegd door de BCE-vouw. Merk daarentegen op dat Watson-Crick-basenparen niet goed aan deze vereisten zouden voldoen.

De nieuwe parameterhoeken, , bieden een zeer coherente vereenvoudiging van de beschrijvingen van haarspeldlussen die G·A-, A·A- of U·G-basenparen bevatten. Er zijn meer studies nodig om na te gaan of andere haarspelden kunnen worden gereproduceerd met de BCE-benadering en beschreven in termen van parameterhoeken, . Als dat zo is, zouden ze de eerste kwantitatieve metingen opleveren om de structuren van DNA- en RNA-haarspeldlussen en mogelijk van vele andere belangrijke biologische macromoleculen te classificeren en te begrijpen.


Resultaten

Structuurbepaling

Voor kristallisatiedoeleinden hebben we een afgeknotte vorm van ApeXPF gebruikt die resten 19-231 omvat (in het geheel aangeduid als ApeXPF). In oplossing vormt ApeXPF homodimeren, net als de nauw verwante Sulfolobus solfataricus XPF (SsoXPF) (Lally et al, 2004 Roberts et al, 2004 ). ApeXPF kan worden gestimuleerd door een heterotrimere PCNA om 3'-flapstructuren te splitsen, maar SsoXPF heeft een robuustere activiteit in een nuclease-assay en daarom hebben we SsoXPF gebruikt voor de mutatieanalyse (aanvullende figuur S1). We hebben geprobeerd ApeXPF te kristalliseren in aanwezigheid van DNA met een breed scala aan 3′-flappen, haarspelden en Y-structuren, en in sommige gevallen verkregen kristallen, maar geen met goede diffractie-eigenschappen. Trigonale kristallen werden uiteindelijk verkregen met behulp van een 15-meer DNA-duplex, ze diffreerden tot een resolutie van 2,8 A en bevatten een enkele ApeXPF-dimeer (tabel I). De structuur werd opgelost door moleculaire vervanging met als zoekmodel het ApeXPF-nucleasedomein afgeleid van een gedeeltelijk verfijnde structuur van residuen 19-150 (Lally et al, 2004 Materialen en methoden). De initiële elektronendichtheidskaarten die alleen op de nucleasedomeinen werden gefaseerd, vertoonden een goede dichtheid voor de (HhH)2 domein en het duplex-DNA (aanvullende figuur S2) en maakte het traceren van het hele molecuul mogelijk, afgezien van de interdomein-linker van één protomeer, die wanordelijk is. De uiteindelijke structuur werd verfijnd tot een R-factor van 23,0% en R-vrij van 29,0% bij een resolutie van 2,8 (tabel I).

Eiwit ApeXPF ApeXPF ApeXPF
Formulier Oorspronkelijk 1 mM K2OsO4 Native+dsDNA
Röntgenbron Station 14.2, SRS Station 14.2, SRS Station 9.6, SRS
Golflengte (Å) 1.0000 1.0000 0.9780
Ruimte groep C2 C2 P3221
Eenheidscel parameters (Å) een=210, B=42.7, C=118.7 een=209, B=42.8, C=119.9 een=B=141.3, C=85.3
β=121,4° β=121,4°
Zeen 4 4 2
Aantal metingen 52 273 (7746) 33 163 (4880) 125 841 (8403)
Aantal unieke reflecties 14 887 (2159) 9471 (1414) 21 619 (2463)
Resolutielimiet (Å) 3.2 (3.37–3.2) 3.6 (3.79–3.6) 2.8 (2.95–2.8)
Volledigheid 99.9 (100) 98.5 (99.9) 97.5 (92.8)
Rsym 6.2 (30.8) 5.0 (32.1) 8.3 (39.9)
Gemiddeld l/σ(l) 10.6 (2.4) 13.1 (2.3) 13.7 (2.8)
Rabnormaal 5.0 (23.1)
Rderivaat 26.0 (31.2)
R-factor 0.24 0.23
R-vrij 0.31 0.29
Model 6516 eiwitatomen 3357 eiwitatomen, 608 DNA-atomen, 6 sulfaationen, 1 Mg-ion, 7 H2O
R.m.s. bindingslengtes (Å) 0.02 0.021
R.m.s. bindingshoeken (graden) 1.9 2.2
Ramachandran-plot a a Percentage residuen in de meest gunstige/bijkomend toegestane regio's van de Ramachandran-plot.
86.9%/12.6% 90.0%/8.9%
  • Waarden tussen haakjes verwijzen naar de schaal met de hoogste resolutie die is aangegeven in de rij voor de resolutielimiet.
  • a Percentage residuen dat zich in de meest gunstige/bijkomend toegestane regio's van het Ramachandran-perceel bevindt.

Monokliene kristallen van ApeXPF gekweekt zonder DNA bevatten twee ApeXPF-dimeren en zijn afgebogen tot een resolutie van 3,2 A. Deze structuur werd opgelost door moleculaire vervanging met behulp van de twee domeinen van de DNA-gebonden structuur afzonderlijk als zoekmodellen en geleid door zware atomen die zijn geïdentificeerd op basis van een osmaatderivaat (zie Materialen en methoden). Twee van de vier protomeren hadden een continue dichtheid met inbegrip van de linkersequentie, terwijl de andere twee ongeordende interdomein-linkers hadden. Deze structuur werd verfijnd tot een R-factor van 24,0% en R-vrij van 31,0% bij een resolutie van 3,2 (tabel I).

Structuur van apo-ApeXPF

ApeXPF 19-231 heeft twee gestructureerde domeinen, een N-terminaal nucleasedomein (residuen 19-148) en een (HhH)2 domein (residuen 165-226) verbonden door een 15-residu linker (figuren 1C en 2A). Zoals verwacht naar analogie met Hef (Nishino et al, 2003 ), zowel het nuclease als (HhH)2 domeinen vormen onafhankelijke, nauw verbonden dimeren met een equivalent domein van de tweede protomeer. In deze opstelling zijn de domeinen ontkoppeld. De structuur van het α/β-nucleasedomein is nauw verwant aan het Hef-nucleasedomein en de protomeren maken vergelijkbare dimeercontacten via twee helices (α4 en α5) en een edge-β-streng (β6) (Nishino et al, 2003 ). De actieve plaats ligt in een grote spleet begrensd door de structurele elementen α1′, α2, α3 en een lus tussen strengen β2 en β3 (Figuur 1C). Deze spleet is bekleed met de overgrote meerderheid van XPF-geconserveerde residuen, waaronder de metaalbindende en katalytische residuen van de kenmerkende sequentie E-R-K (E62-R63-K64) die langs de basis van de spleet loopt als onderdeel van streng β4. Er is een dichtheid op een locatie die gelijk is aan de metaallocatie die is waargenomen in Hef (Nishino et al, 2003 ). Een vergelijkbare dichtheid is aanwezig in het ApeXPF-DNA-complex, dat vanwege de hogere resolutie nauwkeuriger laat zien dat de coördinatiegeometrie en afstand tot zijketens van D52 en E62 consistent zijn met het feit dat het een metaalion is, vermoedelijk magnesium.

Elke (HhH)2 domein vormt een integraal vijf-helix domein met twee functionele helix-haarspeld-helix-motieven gerelateerd door pseudo-tweevoudige symmetrie (Thayer et al, 1995 Doherty et al, 1996 Shao en Grishin, 2000 ). Een soortgelijk domein is aanwezig in RuvA (VOB-code 1C7Y) ( Ariyoshi et al, 2000 ). De RuvA (HhH)2 domein heeft een r.m.s. verschil van 1,55 Å (54 C-alfa-atomen) en 1,7 Å (53 C-alfa-atomen) met de (HhH)2 domeinen van de twee protomeren van de ApeXPF-DNA-structuur. ApeXPF heeft twee G-I-G-haarspelden op residuen 179-181 en 211-213. Hoewel de (HhH)2 domeinvouw is eerder waargenomen ( Thayer et al, 1995 Rafferty et al, 1996 Singh et al, 2002), is dit de eerste structuur van een dimeer van (HhH)2 domeinen. Er zijn drie belangrijke contacten in deze overwegend hydrofobe dimeerinterface (Figuur 1C en Aanvullende Figuur S3). Deze centreren rond de verbindende helix die de twee HhH-motieven verbindt, resten van de eerste helix van het eerste HhH-motief en resten C-terminaal aan het tweede HhH-motief. Een C-terminale extensie aan het domein draagt ​​de sterk geconserveerde Y228 bij aan de dimeerinterface.

De twee onafhankelijke dimeren in de asymmetrische eenheid van de apo ApeXPF-kristallen lijken erg op elkaar en beide hebben het linkergebied van één protomeer volledig verlengd. De lokale tweevoudige assen met betrekking tot de protomeren van het nuclease en (HhH)2 domeindimeren vallen respectievelijk niet samen, zodat de ApeXPF-dimeer over het algemeen niet voldoet aan tweevoudige symmetrie (Figuur 2A). Elk van de onafhankelijke apo ApeXPF-dimeren staat in nauw contact met een ander identiek dimeer dat gerelateerd is door de werking van een kristallografische tweevoudige as die een tetrameer genereert. Het contact omvat twee equivalente linkergebieden die een tweestrengs antiparallel vel over de tweevoudige as vormen (aanvullende figuur S4). Vergelijking van beide tetramere rangschikkingen geeft een r.m.s. verschil van 3,4 op 802 C-alfa-atomen.

Structuur van een ApeXPF-dsDNA-complex

De ApeXPF-dsDNA-structuur omvat twee ApeXPF-protomeren (aangeduid met A en B), samen met één DNA-duplex (strengen aangeduid met C en D) (Figuur 2B). De DNA-duplex is gebonden aan het nuclease en (HhH)2 domeinen van protomeer A, en dit definiëren we als site I.Over het algemeen vormt de ApeXPF in het complex een asymmetrische dimeer waarin protomeer A compacter is en een geordende interdomein linker heeft (Figuur 2B). Het vergelijken van de A-ketens van de DNA-gebonden en DNA-vrije vormen laat zien dat wanneer hun nucleasedomeinen over elkaar heen liggen, de twee oriëntaties van de (HhH)2 domeinen zijn gerelateerd door een rotatie van 95 °, wat in de eerste plaats een sluiting is in plaats van een draai (Figuur 2C). Dit verschuift de (HhH)2 domeinen met meer dan 30 Å. De linker vormt een complex scharniergebied met de belangrijkste buigingen op residuen 151-155 en 164. In de DNA-gebonden vorm draagt ​​het L163 bij aan het grensvlak tussen het nuclease en (HhH)2 domeinen (Figuur 1C en Aanvullende Figuur S5).

De DNA-gebonden ApeXPF-structuur wordt gedomineerd door de interactie van de (HhH)2 domein van protomeer A met dsDNA. Interdomein interacties tussen het nuclease en (HhH)2 domeinen van de A-protomeer stabiliseren de ApeXPF-conformatie verder en begraven verschillende aromatische residuen op het grensvlak in de buurt van W169 (Figuur 1C en Aanvullende Figuur S5). Protomer B maakt bijna geen contact met het DNA op plaats I, en zijn nuclease en (HhH)2 domein geen interactie met zijn interdomein linker wordt niet gezien in de elektronendichtheidskaarten, maar moet een verlengde conformatie aannemen omdat protomeer B-residuen 148 en 160 29 A uit elkaar liggen. Er is gesuggereerd dat de interdomeinlinker gevoelig is voor proteolyse vanwege conformationele flexibiliteit (Nishino et al, 2003 ). We hebben daarom ApeXPF-dsDNA-kristallen opgelost en door SDS-PAGE bevestigd dat er geen proteolytische splitsing had plaatsgevonden, waardoor de integriteit van beide linkers werd bevestigd (gegevens niet getoond).

Site I-herkenning omvat binding van een stuk kleine groef van zes basenparen door de (HhH)2 domein van protomeer A en de interactie van een stomp uiteinde (dat een ds/ss-discontinuïteit voorstelt) met het katalytische domein van protomeer A. Het stuk kleine groef herkend door de (HhH)2 domein is slechts twee basenparen verwijderd van het einde van de duplex en dit zorgt ervoor dat wanneer de nuclease en (HhH)2 domeinen worden gekoppeld, wordt het duplex-DNA georiënteerd met het 3'-uiteinde van een streng naast Y123 (Figuur 3A en B). Het 5'-uiteinde van streng D grenst aan een van kristallisatie afgeleid sulfaation gebonden aan R126 van zowel protomeren A als B. Bindend DNA met een tegengestelde polariteit zou niet mogelijk zijn, omdat de HhH-haarspeldvoetafdruk de veel bredere hoofdgroef niet zou kunnen accommoderen . De G-I-G-haarspeld van één HhH-motief bindt twee backbone-fosfaten van T13 en G14 van DNA-streng C, terwijl de andere haarspeld fosfaten bindt van T7 en C8 van de tegenovergestelde sense-streng D (Figuur 3A). Verschillende positief geladen residuen direct na de haarspelden (R182, R183 en R187 van het eerste HhH-motief en K215 en R216 van het tweede HhH-motief) dragen ook bij aan de interactie met de kleine groef. Hiervan omvatten sequentie-onafhankelijke contacten R187-interactie met de C12-fosfaatruggengraat van de C-streng en R216-penetratie in de kleine groef om T7 (D-streng) ruggengraatfosfaat te binden. De unieke oriëntatie van dsDNA wordt ondersteund door een sequentie-afhankelijk contact van R182 van het eerste HhH-motief tot guanine-14 van streng C. Het nucleasedomein van protomer A maakt via hydrofobe interacties contact met een stomp uiteinde van de DNA-duplex (residuen A86, Y123 en G124 ) met de twee eindbases A15 (streng C) en T1 (streng D) (Figuur 3). Het stompe uiteinde is geen kenmerk van XPF-substraten die de voorkeur hebben, maar vertegenwoordigt hier een ds/ss-discontinuïteit en ligt naast een ondiepe hydrofobe groef (Figuur 3B en C) die in contact kan komen met ssDNA (zie hieronder).

Een model met twee locaties voor ds/ssDNA-knooppuntherkenning door XPF

De (HhH)2 domein van protomeer A is een belangrijk onderdeel van site I, maar de (HhH)2 domein van protomeer B is mogelijk ook in staat DNA te binden. We merken op dat de tweevoudige as die betrekking heeft op de (HhH)2 domeinen van protomeren A en B maken een hoek van bijna 45° met de spiraalvormige as van het dsDNA. Kristalcontacten voorkomen de protomeer B (HhH)2 domein van het aangrijpen van dsDNA in de trigonale kristalvorm. In plaats daarvan neemt een sulfaation een positie in die equivalent is aan de fosfaatruggengraatpositie van het DNA gebonden aan het eerste HhH-motief van protomeer A. We hebben daarom gemodelleerd hoe protomeer B's (HhH)2 domein DNA kan binden. Als de (HhH)2 de tweevoudige as van het domeindimeer bevindt zich op 45 ° ten opzichte van de spiraalvormige as van het dsDNA, het roteren van het dsDNA (strengen C en D) rond deze tweevoudige as genereert een tweede vermoedelijk dsDNA-molecuul (strengen C′ en D′) op 90 ° naar het experimenteel waargenomen dsDNA (Figuur 4A). Inspectie van het gemodelleerde DNA in de context van het kristallografisch waargenomen complex toont het ene uiteinde van de C′D′-duplex dicht bij de actieve plaats van het nucleasedomein van protomeer A (Figuur 4B). Er bestaat dus een tweede potentiële DNA-bindingsplaats (aangeduid met plaats II), die de (HhH)2 domein van protomeer B en de actieve plaats van protomeer A, hoewel het in onze structuur niet bezet is.

We nemen ook aan dat ApeXPF vergelijkbare substraatvoorkeuren heeft als SsoXPF, dat 3′-flappen splitst en duplexen verknipt bij voorkeur boven gespreide duplexen (Figuur 4C Roberts et al, 2004 ). Beide voorkeurssubstraten hebben twee segmenten van aaneengesloten dsDNA en daarom zou de waargenomen kristallografische DNA-duplex op plaats I ofwel de stroomopwaartse of stroomafwaartse duplex van dergelijke substraten kunnen vertegenwoordigen. Aangezien bekend is dat XPF alleen splijt binnen de stroomopwaartse duplex van een 3′-flap (Sijbers et al, 1996a , 1996b de Laat et al, 1998 Bastin-Shanower et al, 2003 Osman et al, 2003 Roberts et al, 2003 ), en het 3'-uiteinde van de C-streng op plaats I is 17 van de actieve plaats van protomeer A (en 35 van de actieve plaats van protomeer B), achten we het waarschijnlijker dat dsDNA op plaats I bond vertegenwoordigt het stroomafwaartse deel van een dergelijk substraat. Strand C zou daarom deel uitmaken van de continue streng (of onbeschadigde streng) (Figuur 4B). Dit zou impliceren dat plaats II de stroomopwaartse duplex bindt, die zou worden verwerkt door de actieve plaats van protomeer A. Deze opstelling zou het mogelijk maken dat de XPF-splitsingsplaatsen stroomopwaarts van de ds/ssDNA-junctie zijn, ongeacht of de duplex de actieve plaats of de strengen doorkruist. zijn gescheiden. Het is duidelijk dat om voor beide (HhH)2 domeinen om tegelijkertijd DNA-substraat aan te grijpen, zou een 3'-flapsubstraat bijna 90 ° moeten buigen (Figuur 4B).

Het 3'-uiteinde van de gemodelleerde C′-streng ligt dicht bij het katalytische centrum van protomeer A en grenst aan de absoluut geconserveerde residuen die voor oplosmiddel toegankelijk zijn R26 en R77, net buiten de katalytische spleet (Figuur 4D en E). De C′-streng wordt daarom gepositioneerd met de verwachte polariteit voor de gesplitste streng en met dsDNA naast de actieve plaats, in overeenstemming met experimentele gegevens. De polariteit van de C′-streng (5′-3′) en de aanwezigheid van twee sulfaationen naast de invariante Q81 en R61 suggereren hoe de 3′-flap naar de actieve plaats wordt geleid (Figuur 4D en E). Om beter te kunnen zien hoe de gesplitste streng in de spleet van de actieve plaats is gepositioneerd, zijn XPF-structuren met langere en vertakte DNA-substraten nodig, een doel waar we naar toe werken.

Het 3'-uiteinde van streng C op plaats I grenst aan een ondiepe hydrofobe groef in het nucleasedomein dat zich uitstrekt tussen helices α3 en α4 (Figuur 3B en C). De groef is bekleed met verschillende geconserveerde aromatische residuen gecentreerd op F79 waarvan de afstanden de basenscheiding benaderen, en dit suggereert een ssDNA-bindingsplaats. Producten met een variabele lengte en een kort enkelstrengs gebied in de continue DNA-streng worden gegenereerd door SsoXPF, ERCC1-XPF en Mus81-Eme1 aangezien de splitsingsplaats ergens tussen de 2 en 8 nucleotiden 5 'van de ds/ssDNA-junctie ligt (Figuur 1B ) (Sijbers et al, 1996a , 1996b de Laat et al, 1998 Bastin-Shanower et al, 2003 Osman et al, 2003 Roberts et al, 2003 ). De hydrofobe groef kan een dergelijk gebied vastmaken dat zich uitstrekt vanaf het 5'-uiteinde van de gemodelleerde streng D' (en dus de continue, niet-gesplitste streng in alle substraten voorstelt), door stapeling of intercalatie met DNA-basen van een stuk ssDNA met elektrostatische contacten van R104, R108 en R110 naar de fosfodiester-ruggengraat (Figuur 3B). Mutatie van F63 van SsoXPF naar alanine (equivalent aan F79 van ApeXPF) centraal in deze groef verminderde de katalytische activiteit gedeeltelijk (met een factor twee tot drie) en kan de dominante rol weerspiegelen die wordt gespeeld door het duplex-DNA in plaats van de enkelstrengige opening (Tabel II).

SsoXPF a a We gebruikten SsoXPF voor deze tests omdat het enzym robuuster was dan ApeXPF, zoals weergegeven in aanvullende figuur S4.
Equivalent residu in ApeXPF Gespreide duplex kkat±z.e. (min −1 × 10 3 ) 3′ klep kkat±z.e. (min −1 × 10 3 ) kkat klep/kkat gespreid
Wildtype 720±49 7200±880 10
R61A R77 3±0.1 840±23 280
F63A F79 277±27 4730±88 17
Q65A Q81 3.3±0.4 260±11 79

Een cluster van essentiële niet-katalytische residuen binnen site II

Eerdere experimenten gaven aan dat mutatie van R678 in humaan XPF (equivalent aan R26 van ApeXPF) resulteerde in een volledig verlies van activiteit (Enzlin en Scharer, 2002). Om deze resultaten uit te breiden, hebben we het belang van R77 en Q81 onderzocht door de equivalente mutaties R61A en Q65A in SsoXPF aan te brengen. We gebruikten SsoXPF voor deze testen vanwege de robuustere activiteit en de beschikbaarheid van recombinant Sso heterotrimeer PCNA. Beide mutaties hadden grote effecten op de katalytische activiteit van het enzym naar zowel een gespreide duplex als een 3'-flapsubstraat (Tabel II). Q81 van ApeXPF scheidt R26/R77 van de metaalcoördinerende D52 en E62 van de actieve site. We interpreteren deze gegevens als aantonend dat R26/R77/Q81 een functioneel belangrijk gebied definiëren dat grenst aan de katalytische spleet. Deze residuen zijn niet nodig voor eiwitvouwing en ze bevinden zich te ver van de actieve plaats om direct deel te nemen aan katalyse. Een mogelijkheid is dat deze residuen een rol spelen bij substraatherkenning door de ruggengraat van streng C′, de kandidaat van het model voor de 3′-flap, te verankeren. Van humaan ERCC1-XPF en SsoXPF is aangetoond dat ze meerdere splitsingsplaatsen genereren in de buurt van het ds/ss-knooppunt, en dat verschillende splitsingsproducten zich in de loop van de tijd ophopen ( de Laat et al, 1998 Roberts et al, 2004 ). Deze waarneming kan worden verklaard aan de hand van ons model. Tethering van de stroomopwaartse duplex via protomeer B (HhH)2 domein en R26/R77 gemakkelijk een heterogene set van verankerde DNA-posities kunnen genereren door eenvoudige rotatie van de duplex op plaats II rond zijn spiraalvormige as. Dit zou de positionering van een van de verschillende fosfodiesterbindingen in de spleet van de actieve plaats mogelijk maken, maar zou de kleine groefbinding aan de (HhH)2 domein.

Structurele instandhouding binnen het XPF (HhH)2 domein

Onze structuur identificeert de (HhH)2 domein een centrale rol spelen bij DNA-binding, in overeenstemming met recent biochemisch werk aan een geïsoleerd (HhH)2 domein van SsoXPF en van UvrC ( Singh et al, 2002 Roberts et al, 2004 ). We rapporteren het eerste voorbeeld van hoe (HhH)2 domeinen dimeriseren en daarom analyseerden we (HhH)2 behoud van domeinsequenties binnen de vier verschillende subgroepen van XPF-sequenties: (1) eukaryote XPF's (18 sequenties), (2) ERCC1-achtige (18 sequenties), (3) euryarchaeale XPF's (20 sequenties) en (4) crenarchaeale XPF's (vier sequenties). Uitlijningen werden geoptimaliseerd om te passen bij kernresiduen binnen de vijf spiraalvormige bundel (Figuur 1C Aravind et al, 1999 Shao en Grishin, 2000). Het hydrofobe karakter van de (HhH)2 residuen van het dimeerinterface zijn geconserveerd in de vier groepen, wat aangeeft dat ze waarschijnlijk allemaal hetzelfde dimeer zullen vormen. Verrassend genoeg vertoont de katalytisch inactieve ERCC1-achtige groep de grootste conservering van (HhH)2 domeinen, met name binnen de twee haarspeldmotieven S-V-N-K-T-D (haarspeld 1) en G-L-G-P-Q-K (haarspeld 2, absoluut geconserveerde resten zijn vetgedrukt). Behoud van positief geladen residuen direct na elke haarspeld is typerend voor veel functionele (HhH)2 domeinen aangezien deze residuen ruimtelijk dicht bij de DNA-ruggengraat liggen. De euryarchaeale en crenarchaeale XPF's vertonen de grootste overeenkomst tussen de (HhH)2 domein van beide groepen en hebben elk geconserveerde motieven binnen en naast beide haarspelden. De (HhH)2 domeinen binnen eukaryote XPF's zijn slecht geconserveerd, missen basische residuen in hun tweede haarspelden en hebben bijna geen invariante oppervlakteresiduen. Hydrofobe kernresiduen zijn over het algemeen geconserveerd onder eukaryote XPF's, wat suggereert dat deze (HhH)2 domeinen behouden hun structurele integriteit, maar hun functie kan uiteen zijn gelopen of zelfs verloren zijn gegaan.


1.2 Technieken in biomoleculaire simulaties

1.2.1 Moleculaire mechanica en krachtvelden

Het palet van computationele chemische methoden is steeds veelzijdiger geworden. Uitgaande van de kwantumchemie, waar moleculaire orbitalen en elektronen die deze bezetten worden beschreven, kunnen we elke fysische of chemische eigenschap berekenen die rechtstreeks afhangt van de elektronenverdeling, helemaal tot grofkorrelige moleculaire dynamica-simulaties, waarbij groepen atomen beschreven als kralen interactie door wetten van de Newtoniaanse mechanica, waardoor waardevolle inzichten worden verkregen in de complexiteit van biologische processen op een grotere schaal op cellulair niveau. Ter vergelijking: een haalbare grootte van een systeem dat wordt behandeld door kwantumchemische berekeningen, zelfs vandaag de dag, is niet groter dan een paar honderd atomen, terwijl de empirische methoden, bijv. moleculaire mechanica (MM) kan gemakkelijk enkele honderdduizenden atomen aan, en in het geval van een grofkorrelige benadering - enkele miljoenen atomen. De laatste klasse van methoden is dus populair geworden onder onderzoekers die zich bezighouden met bio-macromoleculaire systemen, die bestaan ​​en functioneren in waterige oplossingen of lipide-omgevingen. De omgeving kan tot 90% van alle atomen in een modelsysteem bevatten, en de aanwezigheid ervan is cruciaal voor de juiste weergave van levende materie. De gigantische sprong in systeemgrootte is mogelijk dankzij de redelijke eenvoud van de MM potentiële energiefunctionaliteit. De potentiële energie wordt berekend door het optellen van de energietermen die interacties tussen gebonden atomen beschrijven (bindingen, hoeken en torsies) en termen die de niet-gebonden interacties beschrijven, zoals van der Waals en elektrostatische interacties (vgl (1.1)). (1.1)

De gebonden termen vertegenwoordigen het uitrekken van bindingen (ik), buigen van valentiehoeken (θ) en rotatie van torsiehoeken (ω) vgl.Figuur 1.1. Drie krachtconstanten: kik, kθ en VN karakteriseren van de energetische kosten ten opzichte van de evenwichtswaarde, die nodig zijn om de waarde van een bindingslengte te vergroten (ik0), hoek (θ0) of rotatie rond een torsiehoek. De torsieterm vertegenwoordigt een periodieke rotatie van een tweevlakshoek met periodiciteit N en fase γ. De niet-gebonden energie is de som van afstoting, aantrekking en elektrostatica tussen niet-gebonden atomen. De parameter εij is gerelateerd aan de diepte van Lennard-Jones (LJ) potentieel, R0ij is de afstand waarop de LJ-potentiaal zijn minimum heeft. Ql is de gedeeltelijke atomaire lading, ε0 is de vacuüm permittiviteit, en Rij is de afstand tussen atoom l en atoom J. De LJ- en Coulomb-potentialen beschrijven de niet-gebonden interacties op korte afstand. De evaluaties van de elektrostatische interacties op lange afstand kunnen moeilijk zijn en werden vaak genegeerd voorbij een specifieke grensafstand, wat resulteerde in benaderingen in een berekening. Met de introductie van Ewald-sommatie en de Ewald (PME)-methode voor deeltjesgaas zijn elektrostatische berekeningen op lange afstand aanzienlijk nauwkeuriger geworden. 12,13

De eenvoud van de functionele vorm van potentiële energie betekent aan de ene kant snelle en gemakkelijke berekeningen, en aan de andere kant dat de nauwkeurigheid van de empirische methoden sterk afhankelijk is van de set empirisch afgeleide parameters die atomen en hun interacties beschrijven. Deze parameters zijn ofwel afgeleid van ab initio of semi-empirische kwantumchemieberekeningen op kleine modelsystemen of door aanpassing aan experimentele gegevens, bijv. Röntgen- en elektronendiffractie, NMR- en IR-spectroscopie. De functionele vorm van de potentiële energie en de empirisch afgeleide parameters kunnen beide worden aangeduid als een krachtveld.

Er zijn een aantal empirische families van krachtvelden beschikbaar, met verschillende gradaties van complexiteit, en gericht op het behandelen van verschillende soorten systemen. De meest populaire ontworpen voor biologische macromoleculen zijn AMBER, 14,15 CHARMM, 16 en GROMOS. 17 Andere krachtvelden, zoals OPLS 18 en COMPASS 19 zijn oorspronkelijk ontwikkeld om gecondenseerde materie te simuleren GAFF 20 een krachtveld dat is ontwikkeld om organische verbindingen samen met bio-macromoleculen te simuleren en GLYCAM 21 een krachtveld dat speciaal is ontwikkeld voor koolhydraten. Zowel GAFF als GLYCAM zijn compatibel met AMBER. Deze krachtvelden variëren enigszins wat betreft de functionele vorm van de potentiële energiefunctionaliteit, voornamelijk in de niet-gebonden termen, evenals waarden van specifieke atomaire parameters. Voor meer details wordt de lezer verwezen naar een recent overzicht van de huidige vooruitgang in empirische krachtvelden voor biomoleculen. 22 Voor grofkorrelige systemen is het meest gebruikte krachtveld MARTINI, 23,24 dat is geparametreerd voor lipiden, eiwitten, koolhydraten en nucleïnezuren. Onlangs is een tool ontwikkeld om kleine moleculen automatisch te parametriseren. 25 Het MARTINI-model is gebaseerd op een vier-op-een mapping, wat inhoudt dat ongeveer vier zware atomen grofkorrelig zijn tot een enkele kraal. De kralen werken voornamelijk samen door Lennard-Jones-parameters samen met harmonische bindingen en hoeken. 23 Andere veelgebruikte grofkorrelige modellen zijn GROMOS 26 en Elba. 27

1.2.2 Basissimulatietechnieken

Om het energielandschap te verkennen dat wordt beschreven door het krachtveld van de moleculaire mechanica, d.w.z. om moleculaire conformaties te bemonsteren, is een simulatie vereist. Dit is ook de route om de microscopische bewegingen en posities van de atomen te relateren aan de macroscopische of thermodynamische grootheden die experimenteel kunnen worden gemeten. 28 Er zijn twee belangrijke simulatiemethoden om biomoleculaire systemen te bemonsteren: moleculaire dynamica (MD) en Monte Carlo (MC) (Figuur 1.2).

1.2.2.1 Moleculaire dynamiek

Moleculaire dynamica is gebaseerd op de tweede bewegingswet van Newton, die de kracht, F, werkte op een atoom tot zijn versnelling, een, d.w.z. de tweede afgeleide van de positie, Q, met betrekking tot tijd, t (vgl (1.2)) (1.2) waarbij m is de massa van het atoom. In een moleculaire simulatie wordt de tijd gediscretiseerd en de positie na een kleine, eindige tijd, Δt kan worden berekend met behulp van een eenvoudige Taylor-expansie (vgl (1.3)) (1.3) en daarom is het gemakkelijk te zien dat de positie Q(t), snelheid dQ(t)/NSt en versnelling d 2 Q(t)/NSt 2 zijn voldoende voor de voortplanting van het moleculaire systeem. De versnelling kan worden berekend uit vergelijking (1.2) en de kracht F wordt verkregen door de energie van het systeem te differentiëren. 29

Een MD-simulatie wordt opgezet door initiële snelheden en posities toe te wijzen aan alle atomen in het systeem.De snelheden worden meestal willekeurig toegewezen, terwijl de posities meestal worden genomen van bijv. een kristalstructuur of geïdealiseerde geometrieën. Daarna wordt de kracht berekend die op elk atoom werkt, wat de bewegingsrichting geeft. De atomen worden in deze richting bewogen, waardoor op elk atoom nieuwe krachten worden uitgeoefend, en de procedure wordt vervolgens een aantal stappen herhaald. Er zijn verschillende numerieke recepten die beschrijven hoe deze integratie van beweging praktisch wordt gedaan, bijv. haasje-over, Verlet of Velocity-Verlet. Ze verschillen vooral in de numerieke stabiliteit en of ze naast het voortplanten van posities ook de snelheden voortplanten. 29

Een belangrijke beperking voor een efficiënte bemonstering met MD is de discrete tijdstap, Δt. Het is wenselijk om een ​​langere tijdstap te kiezen, wat langere simulaties zou opleveren met minder rekenkracht. Echter,t wordt beperkt door de snelste beweging in het gesimuleerde systeem. Voor een atomistisch systeem is de snelste beweging de bindingstrilling tussen een waterstof- en een koolstofatoom, wat Δ . beperktt tot ongeveer 1 fs. Daarom zijn deze bindingen doorgaans beperkt in de simulaties, waardoor een tijdstap van 2 fs mogelijk is. Een alternatief is om de massa van de waterstofatomen te vergroten, waardoor de bindingstrilling effectief wordt vertraagd. 30 In grofkorrelige simulaties is een veel grotere tijdstap mogelijk, meestal tussen 10 en 40 fs, afhankelijk van het model. 23,27

Er kan worden aangetoond dat een simulatie die voldoet aan de tweede bewegingswet van Newton een thermodynamisch ensemble bemonstert met een constant aantal deeltjes, volume en totale energie (kinetisch + potentiaal). Experimenten worden echter meestal uitgevoerd bij constante temperatuur en constante druk of volume. Om zo'n ensemble te bemonsteren, moeten de bewegingsvergelijkingen worden gewijzigd. In het geval van constante temperatuur is een thermostaat vereist en er zijn veel van dergelijke algoritmen. Gangbare benaderingen zijn onder meer (1) het wijzigen van de snelheden (bijv. zwakke koppeling), (2) het introduceren van fictieve deeltjes in een uitgebreid systeem (bijv. Nosé–Hoover), of (3) het introduceren van wrijving (bijv. Langevin-dynamiek). Een uitgebreide bespreking van verschillende thermostaten valt echter buiten het bestek van dit inleidende hoofdstuk en geïnteresseerde lezers worden verwezen naar een recensie over het onderwerp. 31 Net als bij temperatuur kan een constante druk worden ingevoerd door een barostaat die het volume van het gesimuleerde systeem wijzigt. Veelgebruikte benaderingen zijn onder meer (1) het schalen van de doosdimensies (bijv. zwakke koppeling), (2) het introduceren van fictieve deeltjes (bijv. Parinello-Rahman), of (3) het inbrengen van een zuiger. Sommige thermostaten en barostaten zijn beter geschikt voor systemen die ver van evenwicht zijn, terwijl andere beter zijn voor productiesimulaties.

1.2.2.2 Monte Carlo-simulaties

De andere belangrijke bemonsteringsmethode, Monte Carlo (MC), is een statistische techniek waarbij nieuwe conformaties worden gegenereerd door een willekeurige wandeling in de faseruimte door willekeurige verplaatsingen toe te wijzen aan de interne vrijheidsgraden, d.w.z. bindingen, hoeken en torsies. Natuurlijk zijn niet alle conformaties even waarschijnlijk en daarom is de bemonstering zodanig bevooroordeeld dat conformaties worden gegenereerd met een waarschijnlijkheid die is voorgeschreven door het thermodynamische ensemble van belang. De meest gebruikelijke manier om dit te bereiken is door een Metropolis-Hastings-test uit te voeren. 32,33 In een Metropolis MC-simulatie wordt een nieuwe conformatie geaccepteerd met de waarschijnlijkheid, P (vgl (1.4)) P=min[1, exp(−ΔU/kT)] (1.4) waarbij ΔU is het energieverschil tussen de nieuwe en oude conformatie, k is de Boltzmann-constante en t de absolute temperatuur. In de praktijk wordt de energie van de nieuwe en oude conformatie vergeleken en als de nieuwe conformatie lager in energie is, wordt deze behouden voor de volgende stap. Als het een hogere energie heeft, is de Boltzmann-factor exp(−ΔU/kT) wordt vergeleken met een uniform willekeurig getal tussen 0 en 1, en als de Boltzmann-factor hoger is dan het willekeurige getal, wordt de nieuwe conformatie behouden.

Een MC-simulatie bestaat uit een aantal zetten, wat een recept is voor het testen van specifieke vrijheidsgraden. Dit kan een eenvoudige translatiebeweging zijn waarbij het massamiddelpunt van een molecuul wordt verplaatst, een rotatie rond een torsiehoek of een gecompliceerde, gecoördineerde beweging van verschillende eiwitskeletatomen. Een zet wordt willekeurig gekozen, gevolgd door een Metropolis-test van het nieuwe exterieur en de procedure wordt een aantal stappen herhaald.

De hierboven geïllustreerde Metropolis-test geeft een canoniek ensemble, d.w.z. constant aantal deeltjes, volume en temperatuur. Het kan echter worden aangepast om een ​​volumeverandering mogelijk te maken, zodat een constante druk wordt gesimuleerd. Verder kunnen hele moleculen, bijv. water, kan tijdens de simulatie worden ingebracht en verwijderd, wat leidt tot een groots canoniek ensemble. 34 MC-simulaties zijn dus veelzijdiger dan MD-simulaties, maar zijn sterk afhankelijk van de constructie van efficiënte zetten. Bovendien, aangezien MC alleen afhangt van de posities van de atomen, ontbreekt dynamische informatie en kan MC niet worden gebruikt om bijv. transporteigenschappen of diffusieconstanten schatten.

1.2.2.3 Randvoorwaarden

Een belangrijk aspect van zowel MD als MC is de keuze van randvoorwaarden. 28 Gewoonlijk wordt een molecuul opgelost door een eindige waterschil, of ingevoegd in een lipide dubbellaag, waardoor een deel van de atomen onder vacuüm wordt gelaten. Dit is geen goede fysieke beschrijving van een biologisch systeem, en een veelgebruikte oplossing is om het systeem periodiek in alle drie de richtingen uit te breiden om een ​​pseudo-oneindig systeem weer te geven, waardoor het vacuüm effectief wordt verwijderd. Periodieke randvoorwaarden kunnen worden gebruikt met verschillende geometrieën, een kubusvormige doos, een ruitvormige dodecaëder of een afgeknotte octaëder. Het laatste schema is gebruikelijk in simulaties van biologische macromoleculen gesolvateerd in water, omdat het het minste aantal oplosmiddelmoleculen in het systeem toelaat en dus de berekening versnelt. Hoewel periodieke randvoorwaarden de meest voorkomende keuze zijn, zijn er andere oplossingen in gebruik, bijv. sferische grenzen met toevoeging van beperkingen. 35

1.2.2.4 Verbeterde bemonsteringstechnieken

Zoals eerder vermeld, is efficiënte bemonstering een van de belangrijkste beperkingen van zowel MD als MC. MD-trajecten bereiken mogelijk niet alle relevante conformaties, bijvoorbeeld kortstondige voorbijgaande toestanden die verband houden met een biologische functie. Dit probleem kan worden aangepakt door gebruik te maken van verbeterde bemonsteringsalgoritmen, zoals metadynamica, gestuurde MD of replica-uitwisselings-MD. Vaak is het doel van dergelijke verbeterde bemonsteringen om een ​​vollediger energie-oppervlak te bouwen en/of om vrije energieprofielen of PMF-gegevens (potentieel van gemiddelde kracht) te verkrijgen. Enkele van de meer geavanceerde functies worden behandeld in de volgende hoofdstukken van dit boek. We verwijzen de lezer ook naar recente recensies over verbeterde bemonsteringstechnieken. 36,37

1.2.3 Basisgegevensanalyse

Nadat een simulatie is voltooid, moet deze worden geanalyseerd om relevante informatie over het betreffende systeem te extraheren. Dit kan behoorlijk uitdagend zijn en hangt sterk af van het type gesimuleerd systeem. Hier worden enkele veelvoorkomende strategieën voor analyses geschetst.

1.2.3.1 Eiwitten

Het is gebruikelijk om het evenwicht van een eiwitsimulatie te schatten door de wortelgemiddelde kwadratische afwijking (RMSD eqn (1.5)) van de backbone-atomen te berekenen in vergelijking met de startconformatie, (1.5) waarbij N is het aantal atomen, Rl(t) de positie van atoom l, op tijd t. Voorafgaand aan de analyse moet het eiwit op de startstructuur worden gemonteerd om de algehele translatie en rotatie te verwijderen. Hoewel dit een eenvoudige analyse is en een indicatie geeft van het lokale evenwicht, is het een veel te eenvoudige methode om de globale convergentie van de simulatie te beoordelen. Het is ook mogelijk om een ​​paarsgewijze RMSD te berekenen tussen elke snapshot in een simulatie. Dit kan bijvoorbeeld worden gebruikt om te evalueren hoe efficiënt de bemonstering is geweest, of als de simulatie is vastgelopen in een lokale energiebron (Figuur 1.3). Terwijl de RMSD een algemene schatting geeft voor het gehele eiwit en een benadering om de mate van beweging van individuele residuen te beoordelen, is om de wortelgemiddelde kwadratische fluctuatie (RMSF eqn (1.6)) te berekenen, wat eenvoudigweg de variantie is van de positie van een atoom : (1.6) waar t is de totale tijd van de simulatie (of het aantal snapshots) en is de gemiddelde positie. De RMSF kan worden gerelateerd aan de B-factor die wordt gebruikt in kristallografie door te vermenigvuldigen met 8/3π. De analyse kan per residu worden gedaan, waarbij alle atomen van een residu worden meegenomen in het gemiddelde en bijvoorbeeld kunnen worden gebruikt om de beweging van zijketens te beoordelen. Als alternatief kan men alleen C opnemenα atomen in de analyse om de beweging van de ruggengraat te beoordelen.

Om de algehele compactheid van een eiwit te beoordelen, kan de gyratiestraal worden berekend uit vergelijking (1.7): (1.7) waarbij m is de totale massa van het eiwit, ml de massa van het atoom l en RC het massacentrum. Dit is een eenvoudige analyse om te bepalen of het eiwit compact of uitgebreid is. Om een ​​meer specifieke analyse van de eiwitstructuur te verkrijgen, kan men de secundaire structuur analyseren. Het is mogelijk om elk aminozuur te classificeren om te bepalen of het deel uitmaakt van een helix, een beta-sheet of een lus. Dit is handig om tijdens de simulatie te monitoren om grote conformatieveranderingen te detecteren, d.w.z. verlies van secundaire structuur. Meer gecompliceerde bewegingen kunnen worden onderzocht met een principale componentenanalyse (PCA). Dit is een statistische techniek die de dimensionaliteit van het probleem vermindert in plaats van naar alle drie te kijkenN coördinaten in een simulatie, reduceert PCA dit tot enkele hoofdcomponenten die de belangrijkste bewegingen beschrijven. De belangrijkste componenten worden berekend uit de eigenwaarden van een covariantiematrix, die de covariantie van de posities van geselecteerde atomen beschrijft. Voor een eiwit, typisch de Cα atomen worden geanalyseerd. De hoofdcomponent kan op het gesimuleerde systeem worden geprojecteerd en gevisualiseerd, waardoor een eenvoudige inspectie van de belangrijkste bewegingen mogelijk is. Dit kan bijvoorbeeld een ademhalingsbeweging zijn van twee eiwitdomeinen of de buitenwaartse beweging van een lusgebied bij binding van een klein molecuul.

1.2.3.2 Nucleïnezuren

De conformationele ruimte van DNA of RNA is behoorlijk divers en dynamisch en weerspiegelt hun vermogen om te veranderen afhankelijk van de fysisch-chemische eigenschappen van de omgeving, het lokale sequentiemotief en interacties met andere moleculen. Dus, afgezien van RMSD en analyse van de inter- en intramoleculaire netwerken van contacten, is de beoordeling van nucleïnezuursimulaties gericht op het vastleggen van een dergelijk conformationeel samenspel. De geometrie van DNA, en tot op zekere hoogte RNA, kan worden beschreven in termen van helixparameters (pitch en diameter van de helix), groefparameters (diepte en breedte), furanoseringconformatie, zes torsiehoeken van de ruggengraat, rotatie (tip en helling) en translatieparameters voor basenparen, zes parameters binnen de basis (gesp, propeller, opening, afschuiving, rek en verspringing) en zes parameters tussen basen (kantelen, rollen en draaien, verschuiven, schuiven en stijgen). De meest populaire programma's die nucleïnezuursimulaties analyseren in termen van de genoemde vrijheidsgraden zijn Curves+ en Canal, 38 en 3DNA. 39 Aangezien nucleïnezuren bestaan ​​en als zouten functioneren, is het gedrag van de omringende tegenionen een integraal onderdeel van de analyse, en kan nu worden gedaan met, bijv., het programma Canion. 40

1.2.3.3 Membranen

Om het evenwicht van een membraansimulatie te beoordelen, worden typisch verschillende eenvoudige geometrische eigenschappen berekend, zoals het gebied en het volume per lipide en de dikte van het membraan. 41 De oppervlakte en het volume kunnen eenvoudig worden berekend uit de doosafmetingen en door de waterdichtheid aan te nemen. Er zijn verschillende soorten diktes die kunnen worden berekend, maar een eenvoudige is om de afstand tussen de pieken van de dichtheid van de fosfaatatomen (of equivalent) te meten. Het is ook gebruikelijk om een ​​volgordeparameter van de vetacylketen te berekenen (eqn (1,8)) (1,8) waarbij θ is de hoek tussen de dubbellaagse normaal en een koolstof-deuteriumbinding in de acylketen, en de haakjes geven een gemiddelde aan over de simulatie. Voor grofkorrelige simulaties vervangt de binding tussen twee naburige atomen de koolstof-deuteriumbinding. Het is daarom niet correct om ordeparameters uit atomistische en grofkorrelige simulaties te vergelijken. In beide gevallen geeft de orderparameter informatie over de fase van het membraan, d.w.z. als het zich in de vloeibare of vloeistof-geordende fase bevindt.

1.2.3.4 Kleine moleculen

Bij het uitvoeren van simulaties op kleine moleculen (hetzij als gesolvateerde entiteiten, in een groter ‘bulk’-systeem, of als onderdeel van bijv. een biomoleculair complex), is clustering een interessante analyse om uit te voeren. Dit geeft informatie over verschillende soorten conformaties die het molecuul tijdens een simulatie bereikt en kan worden gebruikt om zowel te beoordelen of de simulatie vastzit in een lokale conformatie als om de waarschijnlijkheid van verschillende conformaties te onderzoeken. Er is een overvloed aan verschillende clusteringmethoden beschikbaar en buiten het bestek van deze tekst om ze uitgebreid te bespreken, wordt de geïnteresseerde lezer verwezen naar de literatuur. 42

1.2.4 Software

Met de ontwikkeling van nieuwe simulatiealgoritmen en nieuwe technologieën in het ontwerp van hardwareplatforms, zijn moleculaire simulaties de afgelopen twee decennia dramatisch toegenomen in omvang, lengte en systeemcomplexiteit. De opkomst van een verscheidenheid aan gestandaardiseerde softwarepakketten voor moleculaire modellering, waaronder GROMACS, 43 Amber, 44 CHARMM, 45 GROMOS, 46 en NAMD, 47 heeft het gebied van computationele chemie getransformeerd door moleculaire simulaties te vercommercialiseren en toegankelijk te maken voor een bredere groep onderzoekers . Al deze pakketten hebben complementaire sterke punten en profielen, waarbij GROMACS en NAMD twee van de meest populaire zijn. Aangezien GROMACS en NAMD alleen MD-engines zijn, is er geen dramatisch verschil in hun prestaties, beide werken met een verscheidenheid aan krachtvelden en hebben GPU-versnelling geïmplementeerd. Er moeten echter kleine verschillen worden vermeld, zoals de mogelijkheid om QM/MM-simulatie in GROMACS uit te voeren, of de uitbreidbaarheid van NAMD naar door de gebruiker geschreven scripts. Beide pakketten worden gratis verspreid met broncode. Bovendien zijn er voor NAMD downloadbare binaire bestanden voor verschillende platforms. Dit kan handig zijn voor een beginner in computationele chemie, aangezien het compileren van MD-software niet altijd eenvoudig is. Zowel GROMACS als NAMD zijn parallelle moleculaire dynamische motoren, ontworpen voor krachtige simulaties van grote biomoleculaire systemen, waarbij GROMACS beter is voor simulaties van kleinere systemen op middelgrote supercomputers. Om de beste prestaties voor een bepaald systeem op een bepaalde supercomputer te bereiken, raden we aan om eerst te benchmarken. Voor zowel GROMACS als NAMD is een grote verscheidenheid aan tutorials beschikbaar. Externe softwarepakketten, zoals PLUMED, 48 kunnen extra functionaliteit bieden, zoals de hierboven genoemde verbeterde moleculaire dynamica-technieken.

Verschillende stukjes software worden gebruikt voor visualisatie en analyse van moleculaire dynamica-trajecten. Een van de meest populaire en vrij toegankelijke tools zijn moleculaire modelleringsprogramma's VMD 49 en USCF Chimera. 50 VMD (visuele moleculaire dynamica) is een gespecialiseerd moleculair visualisatieprogramma voor het weergeven, animeren en analyseren van moleculaire dynamica-trajecten, dat veel wordt gebruikt met alle MD-software. USCF Chimera, aan de andere kant, is een zeer uitbreidbaar programma voor interactieve visualisatie en analyse van moleculaire structuren en gerelateerde gegevens, waaronder dichtheidskaarten, supramoleculaire assemblages, sequentie-uitlijningen, koppelingsresultaten, trajecten en conformationele ensembles. Beide programma's kunnen worden gebruikt om professionele illustraties te maken. VMD en USCF Chimera kunnen ook elementaire structurele analyses uitvoeren, maar voor uitgebreidere beoordeling van trajecten, zoals clustering of modificaties van systeemtopologieën, wordt AmberTools en in het bijzonder cpptraj 51 aanbevolen.

1.2.5 Voorbeelden

Moleculaire simulaties zijn in tal van toepassingen gebruikt om de structuur en dynamiek van veel biomoleculen te verkrijgen om biochemische functies, processen en routes op te helderen. In principe kan elk moleculair systeem worden gesimuleerd, en twee typische voorbeelden worden getoond in figuur 1.4. Hoewel veel van de simulaties individuele macromoleculen hebben bestudeerd die zijn opgelost in water of een modelmembraan, is er ook enige moeite gedaan om naar grotere assemblages te kijken. Al tien jaar geleden gebruikten Schulten en collega's een enorm parallelle supercomputer om het volledige satelliettabakmozaïekvirus te bestuderen, beschreven met een volledig atoomkrachtveld. 52 Ze waren in staat om 50 ns simulatietijd van een systeem met ongeveer 1 miljoen atomen te accumuleren en konden concluderen dat de viruscapside onstabiel werd na verwijdering van de kern-RNA-moleculen. Met behulp van een grofkorrelig model simuleerden Sansom en collega's het influenza A-virion, een aanzienlijk groter systeem. 53 Door een CG-model te gebruiken, konden ze op de microseconde tijdschaal simuleren en daarnaast veranderingen in de membraanomhulling en gevoeligheid voor temperatuur onderzoeken.

Lange-tijdschalen, zoals micro- of milliseconden, zijn over het algemeen niet toegankelijk bij gebruik van een volledig atoomkrachtveld. De uitzondering is als er hardware voor speciale doeleinden wordt gebruikt, zoals in het werk van Shaw en collega's. Ze rapporteerden de eerste continue milliseconde-simulatie van een beschreven eiwit met een krachtveld van alle atomen toen ze de gevouwen structuur van BPTI bestudeerden. 54 Er werden verschillende verschillende conformationele toestanden gevonden, gescheiden door grote kinetische barrières. Shaw en collega's hebben ook simulatietechnieken gebruikt om gebreken te vinden in de huidige eiwitkrachtvelden, die voorheen niet konden worden gedetecteerd vanwege de typisch korte simulaties. Een alternatief voor het uitvoeren van lange, continue trajecten dat de laatste tijd populair is geworden, is het samenstellen van veel korte simulaties met behulp van Markov-toestandsmodellen. 55 Ze zijn bijvoorbeeld gebruikt om eiwitvouwing te bestuderen en hoe dit enorm gecompliceerde proces wordt beïnvloed door het oplosmiddeleffect en elektrostatica. 56

Bovenstaande voorbeelden zijn uitersten, zowel qua systeemomvang als qua lengte van de simulaties. Moleculaire simulaties van veel bescheidener afmetingen worden routinematig gebruikt om inzicht te krijgen in biologische processen en om wet-lab experimenten aan te vullen. We vinden een zeer vruchtbare toepassing van simulaties op het gebied van enzymologie. 57 Hier worden het substraat, enkele actieve siteresiduen en coördinerende wateren en ionen beschreven met kwantummechanica, terwijl de rest van het systeem wordt beschreven met een moleculair mechanisch krachtveld. Dergelijke simulaties zijn in tal van toepassingen gebruikt om bijvoorbeeld het enzymatische mechanisme op te helderen, de aard van het katalytische vermogen en het enzymontwerp te begrijpen. 57,58 Een andere veel voorkomende toepassing van moleculaire simulatie is de schatting van bindingsvrije energieën van kleine moleculen, bijv. drugs, naar hun doelen.Jorgensen en collega's gebruiken dergelijke simulaties routinematig om te helpen bij hun medicijnontwerppijplijn. 59 Dit wordt gedaan door systematisch kleine chemische groepen zoals een hydroxyl- of methylgroep in een loodverbinding te introduceren en de bijdrage ervan te evalueren met alchemistische vrije-energiesimulatie.

De bovenstaande illustraties bieden een paar voorbeelden van wat er mogelijk is met moleculaire simulaties, en in de volgende hoofdstukken van dit boek komen er nog veel meer bij.


Auteurs informatie

Huidig ​​adres: VIB/UGent, Gent, België

Voorkeuren

Onderzoeksinstituut voor moleculaire pathologie (IMP), Wenen BioCenter (VBC), Wenen, Oostenrijk

Marcin J. Suskiewicz, Bence Hajdusits, Rebecca Beveridge, Alexander Heuck, Lam Dai Vu, Robert Kurzbauer, Karl Mechtler, Anton Meinhart & Tim Clausen

Boehringer Ingelheim RCV GmbH & Co KG, Wenen, Oostenrijk

Katja Hauer, Vanessa Thoeny & Klaus Rumpel

Instituut voor Moleculaire Biotechnologie van de Oostenrijkse Academie van Wetenschappen (IMBA), Wenen BioCenter (VBC), Wenen, Oostenrijk

Medische Universiteit van Wenen, Wenen BioCenter (VBC), Wenen, Oostenrijk

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

U kunt deze auteur ook zoeken in PubMed Google Scholar

Bijdragen

MJS en TC ontwierp en voerde experimenten uit, analyseerde gegevens en schreef het artikel met input van alle auteurs B.H., A.H. L.D.V., R.K., K.H., V.T., K.R. en A.M. geholpen met biochemische en structurele analyses R.B en K.M. met massaspectrometrische metingen.

Corresponderende auteur


Bekijk de video: What is DNA and How Does it Work? (Februari 2023).