Informatie

Atomaire coördinaten van eiwitten verkrijgen vanuit tweevlakshoeken

Atomaire coördinaten van eiwitten verkrijgen vanuit tweevlakshoeken


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

https://en.wikipedia.org/wiki/Dihedral_angle#/media/File:Protein_backbone_PhiPsiOmega_drawing.svg

Ik heb gelezen over eiwit-aminozuursequenties en hun 3D-structuur. Het lijkt erop dat de 3D-structuur wordt gecodeerd door de drie torsiehoeken zoals hierboven weergegeven. Mijn professor zei dat er een 1-1-codering is tussen 3D-cartesiaanse coördinaten en de torsiehoeken, maar ik kan geen manier vinden om dit te doen in pyrosetta of biopython. Zijn er formules/pakketten die van pas kunnen komen bij deze conversie?


Zoals ik in mijn reactie aangaf:

  1. Je hebt de aminozuurvolgorde en waarden voor bindingslengtes nodig voordat je de atomaire coördinaten uit de tweevlakshoeken kunt bepalen.
  2. Oorspronkelijk worden de tweevlakshoeken berekend uit de experimenteel atomaire coördinaten (met behulp van de reeks), zodat wat u voorstelt in zijn aard een academische oefening is.

Er is echter een situatie waarin ik dat - in feite - heb gedaan bij het onderzoeken van de structuren die zouden worden geproduceerd als de tweevlakshoeken zouden worden gevarieerd. In plaats van een opdrachtregelprogramma is er een grafisch hulpmiddel waarmee u de hoeken interactief kunt variëren en de resultaten kunt bekijken. Dit is de uitstekende Ramachandran Plot Explorer (Rama) van Bosco Ho. En ja, het kan ook de coördinaten genereren - u kunt de resultaten opslaan in PDB-formaat om te heropenen of te visualiseren met andere grafische eiwitsoftware, zoals JSmol.

Het enige probleem is dat de laatste versie van deze software in 2006 werd uitgebracht en niet 64-bits is, dus het zal niet draaien op de volgende versie van Mac OS X (geen idee van Windows). Bosco's blog is nog steeds actief, dus misschien kan hij worden overgehaald...


Atomaire coördinaten van eiwitten verkrijgen vanuit tweevlakshoeken - Biologie

Sunghoon Jung *

Seoul National University, Seoul, Republiek Korea

* Overeenkomstige auteurs: Sunghoon Jung, Inhun Officetel, 3Gil 8, Nakseongdae-ro, Guanak-gu, Seoel, Republiek Korea

Ontvangen: 12 januari 20201 Geaccepteerd: 17 februari 20201 Gepubliceerd: 22 februari 20201

Citaat: Sunghoon Jung. De snelste simulatie van het vouwen van eiwitten op basis van torsiehoeken. Journal of Bioinformatics and Systems Biology 4 (2021): 1-12.

Abstract

Achtergronden: Een enorm aantal mogelijke conformaties in de eiwitstructuursimulatie hebben ertoe geleid dat moleculaire dynamica-onderzoekers tot nu toe gefrustreerd zijn geraakt. Sommige methoden met gebreken eindigden hun experimenten in een mislukking. Hierdoor konden ze de structuur en functie van gevouwen eiwit in stabiele toestand met de laagste potentiële energie niet bepalen. Deze bestaan ​​blijkbaar in de natuur. Het doel van het oplossen van een eiwitvouwroute die de torsie-inertie van eiwitruggengraatresiduen volgt, werd bereikt.

Resultaten: Er werd een nieuwe methode aangenomen, torsiehoekmodellering, gericht op de rotatie van tweevlakshoeken. De potentiële energie werd berekend door torsiehoeken van het peptide met 8 residuen te roteren. Er werd gevonden dat wanneer ze bewegen in de volgorde van torsietraagheid, 8 residuen achter elkaar zwenken. Zes passages werden herhaald om de laagste waarde te vinden.

Conclusie: De torsiehoek van de eiwitruggengraat speelt een zeer belangrijke rol bij het voorspellen van de eiwitstructuur. Eigenlijk was het duizend keer sneller of meer dan andere om het voor de hand liggende pad te krijgen.

Trefwoorden

Simulatie van eiwitstructuur Co-translationele vouwing Eiwitruggengraat Tweevlakshoek Torsiehoek Torsietraagheid Eiwitvouwroute TorsAlign ProtTorter

Artikelen voor simulatie van eiwitstructuur Artikelen voor co-translationele vouwing Artikelen voor eiwitruggengraat Artikelen voor tweevlakshoek Artikelen voor torsiehoeken Artikelen voor torsie-inertie Artikelen voor vouwpaden voor eiwitten TorsAlign artikelen ProtTorter artikelen

Artikeldetails

Afkorting:

BLAST: Basis zoekhulpmiddel voor lokale uitlijning DNA: deoxyribonucleïnezuur mRNA: boodschapper ribonucleïnezuur NMR: nucleaire magnetische resonantie PDB: eiwitdatabank ProtTorter: eiwitvervormer RamRMSD: Ramachandran plot root mean square deviatie RNA: ribonucleïnezuur SAINT: een sequentieel algoritme geïnitieerd bij de stikstofterminus TM-align: sjabloonmodellering-algin TorsAlign: torsiehoekuitlijning

1. Inleiding

Simulatie van eiwitstructuur is de belangrijkste in de bio-informatica. In de voorspellingsmethoden zijn er homologiemodellering, threading en ab initio-modellering. Ab initio begint zonder enig resultaat van experiment. Dit is dus nuttiger dan alle andere om de structuur van het onbekende eiwit te onderzoeken. Dit construeert zijn structuur door fysieke methoden tot de kale atomen van het eiwit. Maar dit brengt de gebreken van onnauwkeurigheid en traagheid met zich mee dan andere in voorspelling [1]. Een algoritme ontwikkelen voor ab initio modellering om de eiwitstructuur te simuleren is erg belangrijk [2]. Dit heeft twee soorten algoritmen, de ene is moleculaire dynamica (MD) en de andere is Monte Carlo (MC). Dit maakt de locatie van atomen willekeurig om de eiwitstructuur in de 3D-ruimte te voorspellen. Dat stelt krachtvelden in om op elk moment atoomposities in te schatten. Er is exponentiële tijd besteed aan het berekenen van alle onbekende eiwitconformaties met behulp van de computer met de hoogste capaciteit met MC en MD. Merk op dat de structuur van het eiwit verandert tussen microseconden, en bovendien vinden de posities van de atomen in deze structuur plaats in kortere pico- en femto-seconden. Het verkrijgen van een stabiele vorm van het molecuul is dus nog steeds moeilijk voor onderzoekers.

In de natuur vouwt eiwit sneller en natuurlijker dan dit. In vivo vouwen is namelijk sneller dan in vitro. Dus Levinthal sprak paradoxaal genoeg aan dat er een duidelijk pad is in het vouwen [3]. Dit is waar. En Karplus suggereerde dat de &lsquobias naar de inheemse staat&rsquo over een groot deel van het effectieve energieoppervlak het vouwproces kan beheersen [4]. We begrijpen dat dit de vouwroute is die optreedt bij eiwitsynthese van mRNA-transcript. Computationele simulatie van deze co-translationele vouwing op basis van de numerieke bewijzen verscheen in 1995 [5-7]. Daarnaast introduceren we veel experimentele bewijzen en meningen van onderzoekers voor eiwitvouwing tijdens intracellulaire gentranslatie [8, 9].

Het is de moeite waard om naar cotranslationeel vouwen te kijken, omdat er verschillen zijn tussen gesimuleerde en experimentele structuren. We hebben de structuren afgeleid van cotranslationele en torsie-algoritmen. Cotranslationele vouwsimulatie werd eerder beheerd met behulp van het SAINT-algoritme [7]. In dit experiment werd 3D moleculaire dynamica gebruikt. Alle bewegingen in de cartesiaanse ruimte werden door de meeste onderzoekers als mogelijk beschouwd in de meeste moleculaire dynamica-algoritmen. Deze gebruiken sterke covalente bindingsrek- en bindingshoekbuigtermen in hun krachtvelden. Hoewel het uitrekken van covalente bindingen en buiging van de hoek van de binding worden beïnvloed door het krachtveld, laat deze beschrijving van het model het feit los dat alleen rotaties rond een covalente enkelvoudige binding plaatsvinden. We gebruikten dus de torsiehoek van de ruggengraat als de enige vrijheidsgraad om de beweging van eiwitvouwing te beschrijven. Deze modellen kunnen de interpretatie van het mechanisme van eiwitvouwing belemmeren. En handige handmatige aanpassingen zijn voorbehouden aan onderzoekers. Deze moeilijkheden kunnen worden opgelost door de torsiehoekmethode. Dit is ook realistischer dan andere 3D-modellen vol roosterbenaderingen.

2. Methode:

Het polypeptide is een vrij draaiende ketting en heeft hefbomen die tegen watermoleculen botsen. De botsing in de eiwitvouwing in de cel volgt de Brownse beweging. Het is veel sterker. De berekening van de translationele moleculaire kinetiek is gebaseerd op de translationele enthalpiegegevens. Dus de kinetische energie van het watermolecuul is,

Deze snelheid is snel genoeg om het residu van de ruggengraat met koppels te roteren [10, 11]. De torsietraagheid in de wartels is voor elk aminozuur verschillend. In een backbone roteert slechts één residu, de andere niet. Terwijl de eerste een kleine traagheid heeft, heeft de laatste een grotere. Het verschil in torsietraagheid komt van het type en aantal atomen en de lengte van de zijketen, en de massa en lengte van de ruggengraat aan beide zijden van het residu. Het middelste residu heeft een kleine rotatietraagheid, omdat de rotatietraagheid evenredig is met het kwadraat van de afstand. Het volgende (Figuur 1) vertegenwoordigt slechts twee residu's van vele in de ruggengraat. Van deze verbonden residuen werden slechts twee residuen met de minste rotatietraagheid getoond. Tussen hen heeft A een kleinere rotatietraagheid dan B. Wanneer watermoleculen botsen, roteert A eerst. B is een residu dat stopt terwijl residu A ronddraait en terugkeert zodra A stopt.

Figuur 1: Koppel tussen twee resten in een ruggengraat.

Als A stopt met draaien, Peen wordt nul en PB wordt niet verminderd. Dus B kan gemakkelijker draaien. Als A roteert, Peen wordt groter en PB sterk wordt verminderd. Daarom kan B niet gemakkelijk roteren. In figuur 2 is de hoek tussen de as met A-residu en B1 104,5°. Ervan uitgaande dat B roteert terwijl A ook roteert, moet residu A deze rotatiebeweging van residu B verwerken. Als het echter 90° is, omdat de rotatiestraal (R = 1×R0) het langst is, wordt de rotatietraagheid van residu B beïnvloed tot residu A. Aangezien residu A nauwelijks kan draaien zonder de sterkste kracht omdat rotatietraagheid (I = R2×m) is het maximum.

Figuur 2: Verschil van koppel tussen verschillende bindingshoeken.

Om de helft van de grootte van de bovengenoemde kracht te ontvangen, moet deze 135 ° zijn. De straal van B2 is,

De bindingshoek tussen de twee residuen A en B is 104,5°. De traagheid van B2 bij 104,5° is,

Dit is bijna hetzelfde als de waarde van 90° met de meeste moeite. Concluderend, residu B2 kan niet draaien met B1 tegelijkertijd.

In het kort worden al het bovenstaande als volgt samengevat. Als er veel resten van verschillende grootte zijn, roteren ze niet tegelijkertijd. Het residu met de kleinste traagheid roteert eerst. Zodra het stopt met draaien, draait het residu met de volgende kleinste traagheid. Wanneer stopt met draaien, roteert het volgende residu met meer traagheid dan dit. In het geval van meerdere residuen wordt de rotatietraagheid gerangschikt van de kleinste.

De coördinaten van korte polypeptide met belangrijke punten hierboven werden ingesteld. En het werd vergeleken met de structuur van oplossing NMR. De co-translationele vouwing en torsiebeweging van atomen die anders zijn dan andere werd bewezen. Het meest representatieve model van elke NMR-assay werd vergeleken met de structuur van het nieuwe vouwalgoritme. Typische algoritmen voor structuuruitlijning, waaronder TM-align [12] werden niet gebruikt in de vergelijking. Deze algoritmen verplaatsen frame met inserties en deleties, zelfs in het geval van de vergelijking van identieke aminozuursequenties. Het resultaat van de vergelijking werd weergegeven door logPr en RamRMSD [13]. En het werd geïllustreerd in de grafiek van de torsiehoek langs het residunummer (Figuur 3). De verandering van de potentiële energie tijdens de initiële vouwing en volgende optimalisatie wordt ook weergegeven in de grafiek (Figuur 4).

Figuur 3: Tweevlakshoeken van torsiebindingen van gesimuleerde structuren en experimenteel bepaalde structuur.

Figuur 4: Verandering van potentiële energie tijdens de initialisaties en optimalisatie.

Figuur 5: Structuur van 1n9v.

2.1 Gegevensverzameling

Een enkele asymmetrische ketenstructuur werd in het PDB-archief aangenomen op voorwaarde dat de lengte van de keten 8 was, de sequentie-identiteit 90% of minder was en dat er geen heteroatomen waren. Structuren die alleen eiwitten bevatten zonder nucleïnezuren van DNA, RNA of DNA-RNA-hybride werden geselecteerd. Er werden twee structuren van 1n9v en 1oeh ingesteld. En 1oeh werd verlaten omdat het gefragmenteerd was. Ten slotte werd in dit werk 1n9v, het angiotensine-peptide, gebruikt. &lsquoDRVYIHPF&rsquo is de aminozuursequentie van 1n9v.

2.2 Co-vertaling Vouwen van initiële structuur

Cotranslationeel vouwen werd uitgevoerd met ProtTorter met behulp van torsiehoeken. Telkens wanneer een nieuw aminozuur werd toegevoegd, werd de potentiële energie berekend, rekening houdend met elke conformatie na de verandering van &Phi- en &psi-hoeken. Omdat peptidebindingen rond de ruggengraat draaien, veronderstelden we dat ze 1 graad bij 1 graad bewegen. Er werden dus 360 gevallen waargenomen. Lokale minima en het globale minimum werden gehaald. Deze moesten de initiële structuur van angiotensine voorspellen.

2.3 Iteratieve optimalisaties

Deze simulatie werd nauwkeurig door de peptidebotsing met watermoleculen, residuen kregen grotere koppels en vlakke aminozuren om sneller te roteren. De lengte van de zijketen werd geschat als het maximum aan bindingen van het C&alpha-atoom. De volgorde van berekening van het paar bindingen van het residu van de som van de prioriteit van torsie-eigenschap. De 8 aminozuren van 1n9v werden gerangschikt in &lsquoD(7)R(2)V(8)Y(1)I(5)H(4)P(6)F(3)&rsquo. Het kleinere aantal werd het eerst berekend en kreeg een hogere prioriteit. Bijgevolg werd eerst de 4e peptidebinding tussen Tyr (Y) en Ile (I) berekend (1+5=6) en de binding tussen Tyr(Y) en Val(V)(1+8=9). De volgorde van prioriteit is &lsquoD-(3)-R-(4)-V-(2)-Y-(1)-I-(6)-H-(7)-P-(5)-F&rsquo. De getallen tussen de ronde haakjes geven de volgorde van de koppeling tussen de residuen aan. De tweevlakshoeken die de peptidebinding flankeren zijn &phi- en &psi-hoeken. Tussen deze twee tweevlakshoeken hebben we eerst de ene in de buurt van de hogere prioriteit berekend en de andere in de buurt van de lagere prioriteit later. In deze volgorde hebben we iteratief de initiële structuur geoptimaliseerd van cotranslationeel vouwen. Dit werd uitgevoerd tot de convergentie van potentiële energie. De structuur waarin potentiële energie in zes keer samenkwam uit de oorspronkelijke structuur werd genomen.

3. Resultaten

Angiotensine werd gesimuleerd met ProtTorter [14]. Terwijl andere simulatieprogramma's onzichtbaar en onaantastbaar zijn, kan dit elke structuur in elke stap controleren. Dit kan direct manipuleren. Er werd een energetisch stabiele lokale minimastructuur waargenomen die nog kleiner is dan de referentiestructuur. De structuur van 1n9v van de simulatie met ProtTorter wordt getoond in Figuur 5. De lusstructuur werd gevonden in de meeste van de 8 residuen behalve het eerste aspartaatresidu in het angiotensinepeptide. De tweevlakshoeken (&Phi, &psi) lagen gewoonlijk rond het bereik van (25º-30º, 0º-5º). We kunnen het levendige verschil zien tussen deze en andere simulaties (Figuur 3). De experimentele structuur schommelde regelmatig boven en onder de 0º, terwijl de gesimuleerde hoeken positief waren in het N-terminale gebied. Deze weken ver af van het C-terminale gebied.

Na simulatie verkregen we hoeken en lokale energieminima. En deze zijn allemaal voor de duidelijkheid in tabel 1 gerangschikt. De initiële en zes iteraties waren gerangschikt in de rij van de tabel en zeven bindingen in de kolom. Uiteindelijk zijn er 49 argumenten in de tabel geplaatst. De &psi-hoek staat bovenaan de cel en de &phi onderaan. In elke cel worden hoeken en het aantal lokale minima geschreven. De structuur werd gesimuleerd vanuit een zeer grote zoekruimte. Zoals Tabel 1 laat zien, was de initiële structuur van cotranslationele vouwing van ongeveer 52 conformaties. Voor dit peptide samengesteld uit 8 residuen, was de meest stabiele structuur van gewoonlijk ongeveer 70-90 structuren. Het is zeer efficiënt om te vergelijken met typische moleculaire dynamica. LogPr-waarde (tabel 2) geeft het verschil aan tussen de twee vergeleken structuren met meer gewicht op de meer nauwere overeenkomst. Er zijn acht tweevlakshoeken elk voor residu van 1 tot 8 in zowel referentie- als gesimuleerde structuren. Wanneer de twee hoeken van hetzelfde residu erg op elkaar lijken, werden die waarden equivalent gemaakt. Integendeel, ze zijn gemaakt om anders te zijn.

De logPr-waarden van gesimuleerde structuren namen toe naar de latere iteraties, wat de convergentie in optimalisaties impliceert. De laagste logPr-waarde van -15,18 werd waargenomen bij het paar van de 5e en 6e optimalisatie. Het feit dat lagere logPr-waarden in de paren dichterbij gelegen iteraties dan de verder gelegen iteraties werden gevonden. De hoogste logPr-waarde van de paren aangrenzende passages was -4,62 in init. en opt. 1 (Tabel 2). Er waren verschillen tussen het cotranslationele pad en het torsiepad. RamRMSD (Tabel 2) is de RMS (root mean square) afwijking tussen de posities van residuen op de Ramachandran-plot [15]. RamRMSD lijkt op logPr. Dit omvat de groeiende overeenkomst tussen latere iteraties. Paren in nauwere passen hadden lagere RamRMSD-waarden dan verdere passen. De hoogste RamRMSD onder de paren aangrenzende passen was 47,17. Dit werd berekend uit het paar tussen de initiële en de eerste optimalisatiepas.


Atomaire coördinaten van eiwitten verkrijgen vanuit tweevlakshoeken - Biologie

Van: Justin Gullingsrud (justin_at_ks.uiuc.edu)
Datum: wo 04 juni 2003 - 12:29:43 CDT

  • Volgend bericht:Zampighi, Lorenzo: "RE: Situs"
  • Vorig bericht:Justin Gullingsrud: "Re: Tweevlakshoekberekening!"
  • Als antwoord op:Jan Saam: "Re: Tweevlakshoekberekening!"
  • Volgende in draad:Justin Gullingsrud: "Re: Tweevlakshoekberekening!"
  • Berichten gesorteerd op:[ datum ][ topic ][ onderwerp ][ auteur ][ bijlage ]

Op woensdag 4 juni 2003 om 18:37:41 +0200 schreef Jan Saam:
> Hallo Thomas,
> dit script doet het werk.

Dat is waar, hoewel de tweevlaksberekening die in het label-commando wordt uitgevoerd, zal zijn
tientallen keren sneller, vooral omdat het geen atoom hoeft te creëren
selecties om de coördinaten op te halen.

Hier is een klein script in hetzelfde formaat als Jan's script dat de
hetzelfde met de opdracht label. Het gebruikt de huidige tijdstap door
standaard, in plaats van de eerste tijdstap. Het blaast ook alle bestaande weg
Dihedral labels dit komt door een tekortkoming in de scripting
koppel.

proc my_dihed_angle < a1 a2 a3 a4 < frame nu >> <
# Verwijder alle bestaande Dihdral-labels zodat degene die we toevoegen index 0 heeft.
label verwijderen Tweevlakshoeken

# Gebruik het bovenste molecuul
set molid [molinfo top]

# Overschrijf het huidige frame
stel curframe in [molinfo top get frame]
molinfo topset frame $frame

# Voeg het label toe
label toevoegen Dihedrals $molid/$a1 $molid/$a2 $molid/$a3 $molid/$a4

# Krijg zijn waarde
set curval [lindex [lindex [labellijst dihedrals] 0] 4]

# Herstel het oude frame
molinfo topset frame $curframe

Merk op dat als je alleen de waarde van de tweevlakshoek wilt voor alle tijdstappen,
er is een veel snellere manier om dit te doen: de opdracht "labelgraph". Hier is
een script dat de waarden voor alle tijdstappen retourneert:

proc all_dihed_angle < a1 a2 a3 a4 > <
# Verwijder alle bestaande Dihdral-labels zodat degene die we toevoegen index 0 heeft.
label verwijderen Tweevlakshoeken

# Gebruik het bovenste molecuul
set molid [molinfo top]

# Voeg de dihedral-monitor toe
label toevoegen Dihedrals $molid/$a1 $molid/$a2 $molid/$a3 $molid/$a4

# Krijg alle waarden
return [label grafiek Dihedrals 0]
>

>
> Jan
>
> # Berekent de tweevlakshoek van een binding
> # (neemt de indices van de vier tweevlaks atomen als invoer)
> proc dihed_angle < a1 a2 a3 a4 > <
> set coord1 [lindex [[atomselect top "index $a1" frame $frame] get ] 0]
> set coord2 [lindex [[atomselect top "index $a2" frame $frame] get ] 0]
> set coord3 [lindex [[atomselect top "index $a3" frame $frame] get ] 0]
> set coord4 [lindex [[atomselect top "index $a4" frame $frame] get ] 0]
> v1 instellen [vecsub $coord1 $coord2]
> v2 instellen [vecsub $coord3 $coord2]
> v3 instellen [vecsub $coord4 $coord3]
>
> set cross1 [vecnorm [veccross $v2 $v1]]
> set cross2 [vecnorm [veccross $v2 $v3]]
> punt instellen [vecdot $cross1 $cross2]
> if <$dot>1.0 && $dot<1.0001>
> if <$dot<-1.0 && $dot>-1.0001>
> als <$dot>1.0 || $punt<-1.0><
> zet "dihed_angle:dot>1.0, kan acos($dot) niet berekenen"
> >
> hoek instellen [rad2deg [expr acos($dot)]]
> retour $hoek
>
>
> Am Mittwoch, 4. Juni 2003 17:58 schrieb Thomas Hedegaard Pedersen:
> > Hallo,
> >
> > Weet iemand of er een gemakkelijke manier is om tweevlakshoeken te verkrijgen
> > vanuit een tcl-script. Ik ben me ervan bewust dat het voor een eiwit gemakkelijk is om
> > verkrijg de phi- en psi-hoeken door gebruik te maken van: get phi (of get psi),
> > roept, maar is er een of andere manier dat de tweevlakshoek voor een bepaalde selectie
> > van 4 atomen kunnen worden verkregen (door een eenvoudige functie-aanroep).
> >
> > Is het daarnaast mogelijk om sommige delen van een molecuul te roteren door
> > een nieuwe tweevlakshoek specificeren, aangezien het mogelijk is om de opdracht move te gebruiken
> > om atoomselecties over een bepaalde afstand x, y, z te verplaatsen.
> >
> > Bedankt
> >
> > Stoeterij. Polyt.
> > Thomas Hedegaard Pedersen
> > Afdeling Scheikunde
> > Technische Universiteit van Denemarken
>


BESCHRIJVING VAN DE WEBSERVER

PSSweb neemt als input een ensemble van PDB-bestanden van eiwitstructuren. Het voert een uitlijning van meerdere sequenties uit en berekent structurele statistieken voor elke positie van de uitlijning. Er worden verschillende optionele functionaliteiten voorgesteld: structuursuperpositie, Cartesiaanse coördinatenstatistieken, tweevlakshoekberekening en statistiek, en een clusteranalyse op basis van tweevlakshoeken. Er wordt een interactief rapport gegenereerd met daarin een samenvatting van de resultaten met figuren en tabellen. Een overzicht van de PSSweb-mogelijkheden geïllustreerd door een toepassingsvoorbeeld is beschikbaar in Afbeelding 1. De webserver bevat een gedetailleerde helppagina en voorbeelden met commentaar waarin wordt uitgelegd hoe de resultaten moeten worden geïnterpreteerd. Een testcase kan eenvoudig worden geladen met een knop ‘Voorbeeld laden’. Er wordt een link naar de resultatenpagina gegeven op het moment dat de taak wordt ingediend, zodat de gebruiker er een bladwijzer voor kan maken en later toegang kan krijgen tot de resultaten. Er is ook een link naar een ZIP-bestand van de volledige resultatenmap om te downloaden. De servercode voldoet aan de HTML- en CSS-standaarden.

Overzicht van PSSweb-mogelijkheden op een voorbeeldtoepassing. Structuur superpositie. Superpositie van 64 CDK2-structuren op 1HCK:A, gevisualiseerd met een JSmol (5)-viewer. Het L12-helix- en T-lusgebied (residuen 144-166), dat een grote conformationele verandering ondergaat tussen inactieve en actieve toestanden, is gemarkeerd in rood en groen voor respectievelijk de inactieve en actieve toestanden. Cartesiaanse fluctuaties. Standaarddeviatie van Cartesiaanse coördinaten, voor backbone- of zijketenatomen als functie van de uitlijningspositie. Nulpunten in zijketenfluctuaties komen overeen met Gly-residuen. Tweevlakscoördinaatfluctuaties kunnen ook worden verkregen. Tweevlaksverdelingen. Tweevlakkige verdelingen voor het residu Phe152 van inactieve (rood) en actieve (groen) structuren. Gemiddelde waarden en standaarddeviaties, per familie en globaal, worden ook aangegeven. Links: Ramachandran-plot. Centrum:12 verhaal. Rechts: dihedral stripe plot. Clustering De boom wordt verkregen uit hiërarchische clustering met de maximum-linkage-methode. Variabelen waarmee rekening wordt gehouden, zijn de ϕ- en -hoeken van de L12-helix en het T-lusgebied. Inactieve en actieve structuur VOB-codes worden respectievelijk in rood en groen geschreven.

Overzicht van PSSweb-mogelijkheden op een voorbeeldtoepassing. Structuur superpositie. Superpositie van 64 CDK2-structuren op 1HCK:A, gevisualiseerd met een JSmol (5)-viewer. Het L12-helix- en T-lusgebied (residuen 144-166), dat een grote conformationele verandering ondergaat tussen inactieve en actieve toestanden, is gemarkeerd in rood en groen voor respectievelijk de inactieve en actieve toestanden. Cartesiaanse fluctuaties. Standaarddeviatie van Cartesiaanse coördinaten, voor backbone- of zijketenatomen als functie van de uitlijningspositie. Nulpunten in zijketenfluctuaties komen overeen met Gly-residuen. Tweevlakscoördinaatfluctuaties kunnen ook worden verkregen. Tweevlaksverdelingen. Tweevlakkige verdelingen voor het residu Phe152 van inactieve (rood) en actieve (groen) structuren. Gemiddelde waarden en standaarddeviaties, per familie en globaal, worden ook aangegeven. Links: Ramachandran-plot. Centrum:12 verhaal. Rechts: dihedral stripe plot. Clustering De boom wordt verkregen uit hiërarchische clustering met de maximum-linkage-methode. Variabelen waarmee rekening wordt gehouden, zijn de ϕ- en -hoeken van de L12-helix en het T-lusgebied. Inactieve en actieve structuur VOB-codes worden respectievelijk in rood en groen geschreven.

Invoer

Invoergegevens voor PSSweb bestaan ​​uit een set PDB-bestanden met eiwitstructuren en een optionele lijst met posities.

Structuur lijst

Een lijst met structuren is nodig als invoer. Elke invoer bestaat uit een PDB-bestandsbasisnaam, een optionele keten-ID en een optionele door de gebruiker gedefinieerde familienaam. Autodetectie van de eerste keten en van alle ketens van een PDB-bestand is mogelijk met respectievelijk 'first' (standaard) en '*'. Een blanco ketting-ID wordt ingevoerd als '_'. Als de basisnaam het formaat heeft van een PDB-code, wordt geprobeerd het bestand van de PDB-server te downloaden. Het is ook mogelijk om aangepaste PDB-bestanden of ZIP van PDB-bestanden te uploaden. Alleen standaard VOB ATOM-records worden door PSSweb behandeld. Wanneer een atoom alternatieve locaties heeft, wordt alleen de eerste overwogen. Alleen het eerste model van nucleaire magnetische resonantie (NMR) PDB-bestanden wordt gelezen.

Positielijst

Het is soms interessant om de analyse te concentreren op een specifieke subset van aminozuurposities. Om in deze mogelijkheid te voorzien, kan een lijst met functies worden ingevoerd. De lijst Positie beperkt de lijst met aminozuurposities en structurele variabelen die van belang zijn voor bepaalde analyses. Elke invoer bestaat uit nummerreeksen die bepalen welke posities worden opgenomen in de clusteranalyse en in dihedrale distributieplots, en uit tweevlakshoeken die moeten worden opgenomen in clustering. De referentie voor positienummering is de uitlijning van meerdere sequenties.

Uitlijning van meerdere sequenties

Het verkrijgen van een meervoudige uitlijning van invoereiwitsequenties is een essentiële eerste stap in de PSSweb-workflow. PSSweb is inderdaad bedoeld om ensembles van eiwitten met vergelijkbare, maar verschillende sequenties te analyseren en het is nodig voor daaropvolgende analyses om een ​​overeenkomst vast te stellen tussen aminozuurposities van de verschillende sequenties. We merken op dat sommige structurele uitlijningsmethoden geen sequentie-uitlijning als invoer vereisen. We stellen vier verschillende benaderingen voor voor het uitlijnen van meerdere sequenties: PDB-nummering, sequentie-uitlijning met Clustal Omega, sequentie- en sequentie/structuur-uitlijning met MODELLER. De eenvoudigste methode bestaat uit het afleiden van de uitlijning van meerdere sequenties uit PDB-nummering. Hierbij wordt aangenomen dat de residuen op een consistente manier worden genummerd. Het voordeel is snelheid en geen risico op fouten in de uitlijning, met name bij de spleetgrenzen. Als de nummering niet coherent is, geeft deze methode onbetrouwbare resultaten en moet er dus een goede controle worden uitgevoerd bij het gebruik van VOB-nummering. Het Clustal Omega-programma (3) is een snel en schaalbaar algemeen programma voor het uitlijnen van meerdere sequenties, waarbij standaardopties worden gebruikt. De sequentie- en sequentie/structuur-uitlijningsmethoden met MODELLER zijn afhankelijk van de SALIGN (6–8) module van het MODELLER-programma ( 9). Details over de parameters die worden gebruikt met SALIGN zijn beschikbaar in de PSS-documentatie. Sequentie-uitlijningsmethoden zijn de aanbevolen standaardkeuze. De sequentie/structuurmethode wordt aanbevolen voor verder verwante sequenties. Het is niet mogelijk om een ​​algemeen criterium te definiëren om te beslissen welke sequentie-uitlijningsmethode het beste werkt, experimenten worden aangemoedigd en gegenereerde uitlijningen moeten worden beoordeeld op kwaliteit. Een vijfde mogelijkheid die wordt geboden, is het uploaden van een aangepaste uitlijning met meerdere sequenties. De uitlijningsposities zijn standaard vanaf één genummerd. Deze nummering wordt gebruikt om posities te selecteren in volgende analyses, via de lijst Positie. Het kan worden verschoven met de optie 'Eerste uitlijningspositie'.

Superpositie van structuren

Superpositie van structuren kan worden uitgevoerd met het Theseus-programma ( 4) of met het MODELLER-programma ( 9). Theseus gebruikt een maximale waarschijnlijkheidsbenadering, terwijl MODELLER een iteratief kleinste-kwadratenminimalisatie-algoritme gebruikt. De referentiestructuur voor de superpositie kan worden gedefinieerd, anders wordt de eerste structuur genomen. Interactieve 3D-visualisatie van de boven elkaar liggende structuren is mogelijk dankzij een JSmol (5)-viewer op de resultatenpagina. De weergavestijl en kleurmodus kunnen worden gewijzigd en de afzonderlijke structuren kunnen worden weergegeven of verborgen. Visualisatie met JSmol kan traag zijn voor grote ensembles of grote structuren. Het is ook mogelijk om de resultatenmap te downloaden dankzij het meegeleverde ZIP-bestand en om de boven elkaar liggende structuren offline te visualiseren met de PyMOL (10) en VMD (11) scripts inbegrepen.

Cartesiaanse analyse

Structurele statistieken kunnen worden berekend op basis van cartesiaanse coördinaten. Er wordt aangenomen dat structuren eerder op elkaar zijn geplaatst. Cijfers van kwadratische fluctuaties van Cartesiaanse coördinaten en gemiddelde B-factoren, voor ruggengraat- of zijketenatomen, als functie van de uitlijningspositie worden opgesteld. Deze cijfers worden standaard boven elkaar geplaatst, om de vergelijking te vergemakkelijken, kan elke plot worden verborgen/weergegeven. Daarnaast is er een sorteerbare en schuifbare tabel met de gegevens. De cartesiaanse analyse geeft een karakterisering van structurele variaties in het eiwit dat zich langs de sequentie bevindt, waardoor de meest flexibele en rigide regio's kunnen worden geïdentificeerd. Merk op dat het B-factorveld kan worden gebruikt om andere grootheden op te slaan, met name in NMR-structuren.

Dihedrale analyse

Structurele statistieken kunnen ook worden berekend vanuit de tweevlakshoeken. Figuren en tabellen van ϕ, ψ, ω, χ1,2,3 en4 standaardafwijkingen van de tweevlakshoek als functie van de uitlijnpositie worden voorbereid. Bovendien, Ramachandran (ϕ/ψ),12 en individuele tweevlakshoekverdelingsgrafieken worden voorbereid voor elke uitlijningspositie die is gedefinieerd in de Positielijst. Als er verschillende families zijn gedefinieerd in de lijst Structuur, worden verschillende kleuren gebruikt om punten te onderscheiden die bij elke familie horen. Het weergeven van de distributieplots van veel posities kan een substantiële HTML-pagina opleveren. Merk op dat de tweevlakshoek van de ruggengraat ϕ niet is gedefinieerd aan de N-terminale kant van aangrenzende residuen, terwijl ψ en ω niet zijn gedefinieerd aan de C-terminale kant. De tweevlakscoördinaten hebben een intern karakter en worden dus niet beïnvloed door structuursuperpositie. De dihedral-analyse biedt vergelijkbare maar complementaire informatie aan de cartesiaanse analyse (zie het PSS-artikel (2) voor een discussie hierover).

Clustering

De structuren kunnen worden onderworpen aan een hiërarchische clusteranalyse, gebaseerd op de Algorithm::Cluster Perl-module, een interface naar de C Clustering Library (12). Structurele variabelen waarmee rekening wordt gehouden, zijn tweevlakshoeken en kunnen worden beheerd met de Positielijst. De cirkelvormige afstand tussen geselecteerde tweevlakshoeken is de metriek. Maximale koppeling wordt gebruikt. Een boom wordt berekend en de clusters worden verkregen door de boom te snijden volgens de gekozen optie voor de clusterradius (standaard is 60°). De parameter radius komt overeen met de minimaal toegestane afstand tussen clusters. Er wordt een dendrogram-figuur gemaakt om de verkregen clusterboom te visualiseren, met de gekozen snijradius als een stippellijn. Om het opzetten van een andere PSSweb-run met een definitie van families die overeenkomen met de geïdentificeerde clusters te vergemakkelijken, wordt een structuurlijstbestand met clusternummers in de familiekolom geleverd.


Atomaire coördinaten van eiwitten verkrijgen vanuit tweevlakshoeken - Biologie

Een tweevlakshoek van een eiwit is de interne hoek van de ruggengraat van het polypeptide waarbij twee aangrenzende vlakken elkaar ontmoeten. De conformatie van de ruggengraat kan worden beschreven door twee tweevlakshoeken per residu, omdat de ruggengraat tussen twee naast elkaar liggende C&alpha-atomen zich allemaal in een enkel vlak bevindt. These angles are called &phi (phi) which involves the backbone atoms C-N-C&alpha-C, and &psi (psi) which involves the backbone atoms N-C&alpha-C-N.

The dihedral angles of amino acid residues have restricted values due to steric hindrance between the carbonyl oxygen, the hydrogen of the NH group, the hydrogen on the C&alpha carbon and the side chain atoms.

A Ramachandran plot is a way to visualize dihedral angles &phi against &psi of amino acid residues in protein structure. It shows the correlation of &phi and &psi angles in a real polypeptide. The two main allowed regions in the Ramachandran plot around (-60, -50) and (-120, 120) correspond to the two main types of conformations (&alpha helix and &beta sheet) in a protein. A small region around (60, 60) corresponds to left-handed &alpha helix.


Application internals

The peptide backbone sampler and most of helper programs are implemented in ANSI C. A Makefile to be used with GNU make was tested with GNU, Sun Studio, and MIPS Pro C compilers. Below we describe some details of the Metropolis sampler implementation.

Main.c

Mostly contains the main simulation loop and its setup from command line parameters. Other tasks implemented in this file include temperature setup and updates for parallel-tempering or annealing simulations.

Metropolis.c

Contains the implementation of the Metropolis procedure including the initial conformation setup and updates by Metropolis moves. The major data structures are declared, allocated and initialized in this file.

are arrays of orthonormal triplets describing current and trial orientations of planar peptide bonds.

are arrays of structures with current and trial individual amino acid descriptions and atomic coordinates.

are arrays with current and trial pairwise interaction energies between amino acids.

implements crankshaft rotations.

Peptide.c

Implements the polypeptide model with rigid planar peptide bonds with fixed bond lengths and angles. It also contains routines for input and output of coordinates in PDB format.

void carbonate_f () or void carbonate_b

places Cα based on previous or next Cα and peptide bond orientation.

rebuilds amino acid atoms based on alpha carbon position and orientations of peptide bonds around it.

determines orientation of peptide bond between two amino acids.

outputs coordinates in PDB format.

Probe.c

Implements tests and measurements that are to be performed during simulations (e.g., radius of gyration, current total energy, or dihedral angles).

Energy.c

Contains the force field implementation. It implements interactions between amino acids by specifying interactions between their individual atoms that are included in the model. It also contains tests that depend on the force-field implementation.

returns energy of interactions inside a particular amino acid.

returns energy of interactions between two amino acids.

Aadict.c

Implements conversions between standard 1- and 3-letter amino acid abbreviations.

Rotation.c

Implements manipulation of orientation triplets (e.g., rotation matrices, matrix-triplet and matrix-vector multiplication, or Euler angles determination).

Vector.c

Implements vector routines (e.g., dot product, cross product, or dihedral angles).


Protein side-chain structure idealization

After the backbone structure of the target protein has been idealized, we begin to idealize the side-chain structures. When doing this, the idealized backbone structure is considered to be rigid. This approach is widely accepted because previous research suggests that the backbone conformation is archived before the side-chain conformations are archived [14]. After the side-chain idealization, we should have a complete idealized protein structure with all of the backbone and the side-chain structures idealized.

Protein side-chains suffer from low quality problems when determining protein structures. This is mainly because side-chains are not as stable as backbones, and they are more likely to have disorder problems than are backbones in crystals [22]. Thus, the target side-chain structure might be a poor reference for defining the search space and for evaluating the structure similarity score for generated idealized side-chain structures. To address this, we perform an exhaustive search on the entire feasible torsion angle space, instead of the limited torsion angle space, around the target side-chain structure.

Our side-chain idealization method assumes that the side-chain conformations of different residues are independent of each other. Otherwise, all residues with dependencies have to be generated together and the run-time complexity increases exponentially to the number of atoms involved. Bovendien is de Nη 1C ζN εC δ en de Nη 2C ζN εC δ torsion angles of arginine residues are rounded to be either 0° or 180°. Then, the degree of freedom of the search space for each residue is at most four and it is now practical to perform an exhaustive search for each residue independently.

To find the optimal idealized side-chain structure, we design a new scoring function involving the similarity among the generated idealized side-chain structures and the target side-chain structures, and the free energy of the generated idealized side-chain structures. Laten P0 be the target side-chain structure of some residue, and P l voor iedereen l>0 be a generated idealized side-chain structure of the same residue. Then, the scoring function S S C(P l) is defined:

waar met wie k are the weighting parameters, S F(P l) is the free energy score, D H ′ ( P i , P 0 ) is the root mean square divergence (RMSD) of all non-hydrogen atoms, and NS χ(P l,P0) is the RMSD of χ torsion angles.

In our scoring function, the free energy score S F(P l) is defined as a simple χ torsion angle log-odd score, which is similar to the free energy score of our backbone scoring function. Moreover, the log-odd score is based on the popular backbone dependent rotamer library downloaded from Dunbrack’s lab [24]. Certainly, other local free energy scores can be adopted here. Similar to the backbone scoring function, D H ′ ( P i , P 0 ) and NS χ(P l,P0) serve as distance metrics to conserve the side-chain structure.


Referenties

Wüthrich, K. NMR studies of structure and function of biological macromolecules (Nobel lecture). Ange. Chem. Int. Ed. 42, 3340–3363 (2003).

Lange, A. et al. Toxin-induced conformational changes in a potassium channel revealed by solid-state NMR. Natuur 440, 959–962 (2006).

Cady, S. D. et al. Structure of the amantadine binding site of influenza M2 proton channels in lipid bilayers. Natuur 463, 689–692 (2010).

Petkova, A. T. et al. Self-propagating, molecular-level polymorphism in Alzheimer's β-amyloid fibrils. Wetenschap 307, 262–265 (2005).

Wasmer, C. et al. Amyloid fibrils of the HET-s(218–289) prion form a β solenoid with a triangular hydrophobic core. Wetenschap 319, 1523–1526 (2008).

Castellani, F. et al. Structure of a protein determined by solid-state magic-angle spinning NMR spectroscopy. Natuur 420, 98–102 (2002).

Zech, S. G., Wand, A. J. & McDermott, A. E. Protein structure determination by high-resolution solid-state NMR spectroscopy: application to microcrystalline ubiquitin. J. Ben. Chem. Soc. 127, 8618–8626 (2005).

Loquet, A. et al. 3D structure determination of the Crh protein from highly ambiguous solid-state NMR restraints. J. Ben. Chem. Soc. 130, 3579–3589 (2008).

Manolikas, T., Herrmann, T. & Meier, B. H. Protein structure determination from 13 C spin-diffusion solid-state NMR spectroscopy. J. Ben. Chem. Soc. 130, 3959–3966 (2008).

Korukottu, J. et al. High-resolution 3D structure determination of kaliotoxin by solid-state NMR spectroscopy. PLoS ONE 3, e2359 (2008).

Franks, W. T. et al. Dipole tensor-based atomic-resolution structure determination of a nanocrystalline protein by solid-state NMR. Proc. Natl Acad. Wetenschap. VS 105, 4621–4626 (2008).

De Paëpe, G., Lewandowski, J. R., Loquet, A., Böckmann, A. & Griffin, R. G. Proton assisted recoupling and protein structure determination. J. Chem. Fys. 129, 245101 (2008).

Robustelli, P., Cavalli, A. & Vendruscolo, M. Determination of protein structures in the solid state from NMR chemical shifts. Structuur 16, 1764–1769 (2008).

Shen, Y., Vernon, R., Baker, D. & Bax, A. nieuw protein structure generation from incomplete chemical shift assignments. J. Biomol. NMR 43, 63–78 (2009).

Nieuwkoop, A. J., Wylie, B. J., Franks, W. T., Shah, G. J. & Rienstra, C. M. Atomic resolution protein structure determination by three-dimensional transferred echo double resonance solid-state nuclear magnetic resonance spectroscopy. J. Chem. Fys. 131, 095101 (2009).

Zhang, Y. et al. Resonance assignment and three-dimensional structure determination of a human alpha-defensin, HNP-1, by solid-state NMR. J. Mol. Biol. 397, 408–422 (2010).

Jehle, S. et al. Solid-state NMR and SAXS studies provide a structural basis for the activation of αB-crystallin oligomers. Natuur structuur. Mol. Biol. 17, 1037–1042 (2010).

Linser, R., Bardiaux, B., Higman, V., Fink, U. & Reif, B. Structure calculation from unambiguous long-range amide and methyl 1 H– 1 H distance restraints for a microcrystalline protein with MAS solid-state NMR spectroscopy. J. Ben. Chem. Soc. 133, 5905–5912 (2011).

Huber, M. et al. A proton-detected 4D solid-state NMR experiment for protein structure determination. ChemPhysChem 12, 915–918 (2011).

Helmus, J. J., Nadaud, P. S., Höfer, N. & Jaroniec, C. P. Determination of methyl 13 C– 15 N dipolar couplings in peptides and proteins by three-dimensional and four-dimensional magic-angle spinning solid-state NMR spectroscopy. J. Chem. Fys. 128, 052314 (2008).

Jaroniec, C. P., Filip, C. & Griffin, R. G. 3D TEDOR NMR experiments for the simultaneous measurement of multiple carbon–nitrogen distances in uniformly 13 C, 15 N-labeled solids. J. Ben. Chem. Soc. 124, 10728–10742 (2002).

Takegoshi, K., Nakamura, S. & Terao, T. 13 C– 1 H dipolar-assisted rotational resonance in magic-angle spinning NMR. Chem. Fys. Let. 344, 631–637 (2001).

Lange, A., Luca, S. & Baldus, M. Structural constraints from proton-mediated rare-spin correlation spectroscopy in rotating solids. J. Ben. Chem. Soc. 124, 9704–9705 (2002).

Solomon, I. Relaxation processes in a system of two spins. Fys. ds. 99, 559–565 (1955).

Bertini, I., Luchinat, C. & Parigi, G. Solution NMR of Paramagnetic Molecules: Applications to Metallobiomolecules and Models (Elsevier, 2001).

Gillespie, J. R. & Shortle, D. Characterization of long-range structure in the denatured state of staphylococcal nuclease. II. Distance restraints from paramagnetic relaxation and calculation of an ensemble of structures. J. Mol. Biol. 268, 170–184 (1997).

Battiste, J. L. & Wagner, G. Utilization of site-directed spin labeling and high-resolution heteronuclear nuclear magnetic resonance for global fold determination of large proteins with limited nuclear overhauser effect data. Biochemie 39, 5355–5365 (2000).

Gaponenko, V. et al. Protein global fold determination using site-directed spin and isotope labeling. Eiwit Sc. 9, 302–309 (2000).

Pintacuda, G. et al. Solid-state NMR spectroscopy of a paramagnetic protein: assignment and study of human dimeric oxidized Cu II –Zn II superoxide dismutase (SOD). Ange. Chem. Int. Ed. 46, 1079–1082 (2007).

Balayssac, S., Bertini, I., Lelli, M., Luchinat, C. & Maletta, M. Paramagnetic ions provide structural restraints in solid-state NMR of proteins. J. Ben. Chem. Soc. 129, 2218–2219 (2007).

Balayssac, S., Bertini, I., Bhaumik, A., Lelli, M. & Luchinat, C. Paramagnetic shifts in solid-state NMR of proteins to elicit structural information. Proc. Natl Acad. Wetenschap. VS 105, 17284–17289 (2008).

Bertini, I. et al. High-resolution solid-state NMR structure of a 17.6 kDa protein. J. Ben. Chem. Soc. 132, 1032–1040 (2010).

Nadaud, P. S., Helmus, J. J., Höfer, N. & Jaroniec, C. P. Long-range structural restraints in spin-labeled proteins probed by solid-state nuclear magnetic resonance spectroscopy. J. Ben. Chem. Soc. 129, 7502–7503 (2007).

Nadaud, P. S., Helmus, J. J., Kall, S. L. & Jaroniec, C. P. Paramagnetic ions enable tuning of nuclear relaxation rates and provide long-range structural restraints in solid-state NMR of proteins. J. Ben. Chem. Soc. 131, 8108–8120 (2009).

Nadaud, P. S., Helmus, J. J., Sengupta, I. & Jaroniec, C. P. Rapid acquisition of multidimensional solid-state NMR spectra of proteins facilitated by covalently bound paramagnetic tags. J. Ben. Chem. Soc. 132, 9561–9563 (2010).

Nadaud, P. S., Sengupta, I., Helmus, J. J. & Jaroniec, C. P. Evaluation of the influence of intermolecular electron–nucleus couplings and intrinsic metal binding sites on the measurement of 15 N longitudinal paramagnetic relaxation enhancements in proteins by solid-state NMR. J. Biomol. NMR 51, 293–302 (2011).

Ermácora, M. R., Delfino, J. M., Cuenoud, B., Schepartz, A. & Fox, R. O. Conformation-dependent cleavage of staphylococcal nuclease with a disulfide-linked iron chelate. Proc. Natl Acad. Wetenschap. VS 89, 6383–6387 (1992).

Hubbell, W. L. & Altenbach, C. Investigation of structure and dynamics in membrane proteins using site-directed spin labeling. Curr. Opin. structuur. Biol. 4, 566–573 (1994).

Schwieters, C. D., Kuszewski, J. J., Tjandra, N. & Clore, G. M. The Xplor-NIH NMR molecular structure determination package. J. Magn. Reson. 160, 65–73 (2003).

Gallagher, T., Alexander, P., Bryan, P. & Gilliland, G. L. Two crystal structures of the B1 immunoglobulin-binding domain of streptococcal protein G and comparison with NMR. Biochemie 33, 4721–4729 (1994).

Franks, W. T., Wylie, B. J., Stellfox, S. A. & Rienstra, C. M. Backbone conformational constraints in a microcrystalline U– 15 N-labeled protein by 3D dipolar-shift solid-state NMR spectroscopy. J. Ben. Chem. Soc. 128, 3154–3155 (2006).

Shen, Y., Delaglio, F., Cornilescu, G. & Bax, A. TALOS+: a hybrid method for predicting protein backbone torsion angles from NMR chemical shifts. J. Biomol. NMR 44, 213–223 (2009).

Rost, B. & Sander, C. Conservation and prediction of solvent accessibility in protein families. Eiwitten 20, 216–226 (1994).

Delaglio, F. et al. NMRPipe: a multidimensional spectral processing system based on UNIX pipes. J. Biomol. NMR 6, 277–293 (1995).

Iwahara, J., Schwieters, C. D. & Clore, G. M. Ensemble approach for NMR structure refinement against 1 H paramagnetic relaxation enhancement data arising from a flexible paramagnetic group attached to a macromolecule. J. Ben. Chem. Soc. 126, 5879–5896 (2004).

Kuszewski, J., Gronenborn, A. M. & Clore, G. M. Improving the packing and accuracy of NMR structures with a pseudopotential for the radius of gyration. J. Ben. Chem. Soc. 121, 2337–2338 (1999).

Kuszewski, J., Gronenborn, A. M. & Clore, G. M. Improving the quality of NMR and crystallographic protein structures by means of a conformational database potential derived from structure databases. Eiwit Sc. 5, 1067–1080 (1996).

Grishaev, A. & Bax, A. An empirical backbone–backbone hydrogen-bonding potential in proteins and its applications to NMR structure refinement and validation. J. Ben. Chem. Soc. 126, 7281–7292 (2004).

Ryabov, Y., Suh, J-Y., Grishaev, A., Clore, G. M. & Schwieters, C. D. Using the experimentally determined components of the overall rotational diffusion tensor to restrain molecular shape and size in NMR structure determination of globular proteins and protein–protein complexes. J. Ben. Chem. Soc. 131, 9522–9531 (2009).

Schwieters, C. D. & Clore, G. M. Reweighted atomic densities to represent ensembles of NMR structures. J. Biomol. NMR 23, 221–225 (2002).


Resultaten

Recent advances in the analysis of chemical shifts have enabled their values to be used increasingly successfully to obtain information about a number of specific features of protein conformations, notably dihedral angles (2), in some cases with high accuracy. Such measurements do not, however, enable the high-resolution structures of proteins to be defined without the use of extensive additional information, such as that provided, for example, by NOEs or RDC (2, 23), because even small errors in dihedral angles give rise to progressive error accumulation.

Computational Strategy.

The procedure that we present here (termed CHESHIRE, protein structure determination with CHEmical SHIft REstraints) exploits the availability of fast empirical methods that have recently been developed to enable the chemical shifts to be calculated approximately but very rapidly for a given structure (16–18). Our computational strategy is based on the molecular fragment replacement approach used in ab initio structure prediction (Rosetta) (24–26) and in the analysis of RDC (23, 27) and sparse NMR data (28) including unassigned chemical shifts (29).

3PRED.

In the first phase of the procedure (called 3PRED see Methoden:), we use the experimental chemical shifts to predict the secondary structure of protein fragments of three and of nine residues (2). For ≈85% of the residues, we predict correctly whether they are in an α,β or coil conformation (Table 1).

Quality of the structures determined in the present study using chemical shift restraints compared with conventional methods

TOPOS.

In the second phase (called TOPOS see Methoden:), we generate a library of trial conformations for each of these protein fragments by screening a database to search for those of similar sequence, secondary structure, and chemical-shift patterns (see Methoden:). This procedure provides predicted values of backbone dihedral angles that are in ≈95% of the cases within 60° from those in the high-resolution structures determined by conventional methods (Table 1).

Molecular fragment replacement.

In the third phase, these fragments are assembled (Fig. 1), and the structures in the resulting ensembles are refined with the use of a scoring function defined by a combination of chemical shifts and a force field similar to the standard ones used in classical molecular dynamics simulations (see Methoden:). In this phase of the procedure, we effectively exploit the tertiary information contained in the experimental chemical shifts, including orientations of aromatic rings and hydrogen bonds (17). For example, in the case of the 106-residue protein Δ27-GG, if we do not use the chemical-shift information in the refinement stage, we obtain a structure with a backbone root mean square distance (RMSD) of 3.1 Å from the reference structure [Protein Data Bank (PDB) entry 1SA8], rather than 1.46 Å as in the case in which the chemical shifts are used (Table 1). For the same protein, if we do not use the chemical-shift information at any stage of the procedure, we obtain a structure at 6.2 Å from the reference structure.

Schematic illustration of the molecular fragment replacement procedure implemented for chemical shifts in the CHESHIRE procedure. The protein shown is ubiquitin, and fragments are generated with main-chain dihedral angles compatible with the information contained in the chemical shifts. The fragments are then assembled in a combinatorial manner to produce an ensemble of trial structures that are subsequently refined by exploiting the information about tertiary structure contained in the chemical shifts.

Analysis of the Quality of the Structures.

We have applied the CHESHIRE procedure to 11 proteins chosen from the literature to be representative of different structural classes and to have a well defined set ( 1 H, 13 Cα, 13 Cβ, and 15 N) of chemical shifts for the main-chain atoms [Table 1, Fig. 2, and supporting information (SI) Fig. 4].

Comparison of the structures, also showing side chains in the hydrophobic cores, determined from chemical-shift information using the CHESHIRE procedure and those determined by standard x-ray or NMR methods. (EEN) Ubiquitin (blue) and PDB entry 1UBQ (pink). (B) FF domain (blue) and PDB entry 1UZC (pink). (C) Calbindin (blue) and PDB entry 4ICB (pink). (NS) HPr (blue) and PDB entry 1POH (pink).

RMSDs from the reference structures.

In all 11 cases, the overall RMSD between the structures obtained by using the CHESHIRE procedure and the corresponding previously determined high-resolution x-ray or NMR structures, which are used as reference conformations, was between 1.21 and 1.83 Å for the backbone atoms and between 2.13 and 2.61 Å for all atoms (Table 1). The average pairwise backbone RMSDs between the 10 lowest-energy structures determined for each protein range from 1.0 to 1.5 Å.

WHATIF scores.

The overall quality of the structures was assessed by the WHATIF procedure (30), which in all cases resulted in scores that are regarded as good in conventional structures (a summary of the results is reported in SI-tekst ).

Interproton distances.

We also considered all of the interproton distances below 5.5 Å in the reference structures, i.e., distances corresponding to the upper limits defined in conventional NOE-based structure determination. In almost all cases, the corresponding distances in the structures that we determined here are within this bound, and in the few exceptions (Table 1), they exceed it by <1 Å.

Residual dipolar coupling Q factors.

As a further analysis of the quality of the structures, in one case (ubiquitin), for which 344 (HN-N, CA-HA, CA-C, CA-CB) experimental backbone RDC (31) are available, we calculated a Q factor (32) of 0.49, which is comparable to typical Q factors of structures determined from NOE information. In addition, we predicted the same types of RDC for all of the 11 reference structures by using the PALES program (33) and used them to estimate the Q factors of the structures determined here (Table 1). In the case of ubiquitin, this procedure results in an estimated Q factor of 0.55, which is close to one calculated above by using experimental RDC. For the 11 structures, these estimated Q factors range from 0.43 to 0.89.

A Self-Consistent Criterion for Convergence.

To establish, without any knowledge of previously determined structures or additional experimental information, whether the structure of a particular protein has been correctly identified, we use a two-step self-consistent criterion based only on the analysis of the structures generated by the CHESHIRE procedure.

In the first step, the CHESHIRE E score (see Methoden:) of the best structure generated by this procedure is compared with the expected native E score (E pred score). De E pred value for a particular sequence is found by the linear formula E pred = aN res + B, waar N res is the number of residues, and een en B are constants determined by computing the E score on 3,003 randomly selected native structures from the ASTRAL SCOP database, assuming a correlation between experimental and back-calculated chemical shifts close to the SHIFTX accuracy. As shown in SI Fig. 5, there is a linear correlation between the E scoren en N res for this set of 3,003 proteins (correlation coefficient of 0.98). Therefore, we can use the E pred score to estimate the E score for the native state of a protein, even if we do not actually know the structure in advance. We can thus use the E pred score to exclude cases in which the CHESHIRE procedure fails to produce any reliable structural model.

In the second step of the self-consistent criterion, the landscapes of the E score are calculated as a function of the RMSD value from the structure having the best E score (see Fig. 3). Funneled landscapes indicate that the CHESHIRE procedure has generated good structural models, because structures with good E scores but significantly different conformations are absent. For any structure, we define its Z scoren als Z = (E − μ)/σ, where μ and σ are the average and the standard deviation, respectively, of the distribution of the E values of the structures that we generated. Given this definition, a conformation whose E score is more than three standard deviations better than the average is characterized by Z < −3. Our results show that it is very unlikely that a structure will simultaneously have a very low value of the molecular mechanics energy and a very close agreement with the experimental chemical shifts we can therefore conclude that the CHESHIRE structure determination is robust in these cases.

Landscapes of the CHESHIRE scores (E) for four of the proteins analyzed in this work. The landscapes report the E scores as a function of the RMSD from the reference structures (see Table 1) or the structures of minimal CHESHIRE scores (Insets). The proteins are those shown in Fig. 2. In all cases, the Z scores of the best structures are below −3, indicating that the landscapes are funneled toward the native structure. The averages and standard deviations are shown by red horizontal lines. De E pred energies are also shown as horizontal green lines. (een) Ubiquitin. (B) FF domain. (C) Calbindin. (NS) HPr. See also Fig. 2.

In addition to the four cases shown in Fig. 3, we illustrate this two-step criterion for the 150-residue low-molecular-weight protein tyrosine phosphatase (YwIE) from Bacillus subtilis (SI Fig. 6), for which this criterion is not satisfied and therefore the structure is not described. In dit geval is de E pred value (−589) is lower than the lowest E score produced in the fragment assembly procedure (−568) in addition, the landscape of the E score is clearly not funneled.

Thus, our results suggest that the current implementation of the CHESHIRE procedure is able to define structures of proteins up to 120 residues in length. We anticipate that this limit will be increased as our ability to predict the chemical shifts corresponding to given structures improves.


Obtaining protein atomic co-ordinates from dihedral angles - Biology

COVID-19 has impacted many institutions and organizations around the world, disrupting the progress of research. Through this difficult time APS and the Physical Review editorial office are fully equipped and actively working to support researchers by continuing to carry out all editorial and peer-review functions and publish research in the journals as well as minimizing disruption to journal access.

We appreciate your continued effort and commitment to helping advance science, and allowing us to publish the best physics journals in the world. And we hope you, and your loved ones, are staying safe and healthy.

Many researchers now find themselves working away from their institutions and, thus, may have trouble accessing the Physical Review journals. To address this, we have been improving access via several different mechanisms. See Off-Campus Access to Physical Review for further instructions.


Bekijk de video: Bovenbouw Vertering Taak 1a Eiwitten en aminozuren (September 2022).


Opmerkingen:

  1. Gauvain

    Waarschijnlijk heb je het mis?

  2. Gajind

    Het spijt me dat ik u stoor, maar ik stel voor om de andere kant op te gaan.

  3. Hans

    Ik ben het helemaal met je eens.

  4. Dura

    Bedankt, nuttig ding.

  5. Ordwine

    Het spijt me, maar ik denk dat je ongelijk hebt. Ik kan het bewijzen. Schrijf me in PM, we praten.

  6. Leonard

    Deze uitstekende gedachte valt trouwens weg

  7. Deagan

    Mee eens



Schrijf een bericht