Informatie

S2018_Lecture18_Reading - Biologie

S2018_Lecture18_Reading - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Nucleïnezuren

Er zijn twee soorten nucleïnezuren in de biologie: DNA en RNA. DNA draagt ​​de erfelijke genetische informatie van de cel en is samengesteld uit twee antiparallelle strengen van nucleotiden die in een spiraalvormige structuur zijn gerangschikt. Elke nucleotide-subeenheid is samengesteld uit een pentosesuiker (deoxyribose), een stikstofhoudende base en een fosfaatgroep. Interacties die bekend staan ​​als "base stacking" interacties helpen ook om de dubbele helix te stabiliseren. In deze module richten we ons vooral op de chemische structuren van DNA en RNA en hoe deze van elkaar te onderscheiden zijn.

Nucleotide structuur

De twee belangrijkste soorten nucleïnezuren zijn: deoxyribonucleïnezuur (DNA) en ribonucleïnezuur (RNA). DNA en RNA zijn opgebouwd uit monomeren die bekend staan ​​als nucleotiden. Individuele nucleotiden condenseren met elkaar om a . te vormen Nucleïnezuur polymeer. Elke nucleotide bestaat uit drie componenten: een stikstofbase (waarvoor er vijf verschillende soorten zijn), een pentosesuiker en een fosfaatgroep. Deze zijn hieronder afgebeeld. Het belangrijkste verschil tussen deze twee soorten nucleïnezuren is de aan- of afwezigheid van een hydroxylgroep aan de C2 positie, ook wel de 2' positie genoemd (lees "twee priemgetallen"), van de pentose (zie de legende van figuur 1 en het gedeelte over de pentosesuiker voor meer informatie over koolstofnummering). RNA heeft een hydroxyl-functionele groep op die 2'-positie van de pentosesuiker; de suiker heet ribose, vandaar de naam riboNucleïnezuur. Daarentegen mist DNA de hydroxylgroep op die positie, vandaar de naam "deoxy" riboNucleïnezuur. DNA heeft een waterstofatoom op de 2'-positie.

Figuur 1. Een nucleotide bestaat uit drie componenten: een stikstofbase, een pentosesuiker en een of meer fosfaatgroepen. Koolstofatomen in de pentose zijn genummerd van 1′ tot en met 5′ (de prime onderscheidt deze residuen van die in de base, die zijn genummerd zonder een prime-notatie te gebruiken). De basis is bevestigd aan de 1'-positie van de ribose en het fosfaat is bevestigd aan de 5'-positie. Wanneer een polynucleotide wordt gevormd, hecht het 5'-fosfaat van het binnenkomende nucleotide aan de 3'-hydroxylgroep aan het einde van de groeiende keten. Twee soorten pentose worden gevonden in nucleotiden, deoxyribose (gevonden in DNA) en ribose (gevonden in RNA). Deoxyribose is qua structuur vergelijkbaar met ribose, maar heeft een -H in plaats van een -OH op de 2'-positie. Basen kunnen worden onderverdeeld in twee categorieën: purines en pyrimidines. Purines hebben een dubbele ringstructuur en pyrimidinen hebben een enkele ring.
Naamsvermelding: Marc T. Facciotti (origineel werk)

De stikstofbase

De stikstofbasen van nucleotiden zijn organische moleculen en worden zo genoemd omdat ze koolstof en stikstof bevatten. Het zijn basen omdat ze een aminogroep bevatten die het potentieel heeft om een ​​extra waterstof te binden en dus als een base werkt door de waterstofionenconcentratie in de lokale omgeving te verlagen. Elk nucleotide in DNA bevat een van de vier mogelijke stikstofbasen: adenine (A), guanine (G), cytosine (C) en thymine (T). Daarentegen bevat RNA adenine (A), guanine (G), cytosine (C) en uracil (U) in plaats van thymine (T).

Adenine en guanine zijn geclassificeerd als: purines. Het belangrijkste onderscheidende structurele kenmerk van een purine is een dubbele koolstof-stikstofring. Cytosine, thymine en uracil worden geclassificeerd als: pyrimidines. Deze worden structureel onderscheiden door een enkele koolstof-stikstofring. Er wordt van je verwacht dat je herkent dat elk van deze ringstructuren is gedecoreerd door functionele groepen die betrokken kunnen zijn bij een verscheidenheid aan chemie en interacties.

Let op: oefenen

Neem even de tijd om de stikstofbasen in figuur 1 te bekijken. Identificeer functionele groepen zoals beschreven in de klas. Beschrijf voor elke geïdentificeerde functionele groep bij welk type chemie u verwacht dat deze betrokken is. Probeer vast te stellen of de functionele groep kan fungeren als een waterstofbrugdonor, acceptor of beide?

De pentosesuiker

De pentosesuiker bevat vijf koolstofatomen. Elk koolstofatoom van het suikermolecuul is genummerd als 1′, 2′, 3′, 4′ en 5′ (1′ wordt gelezen als "één priemgetal"). De twee belangrijkste functionele groepen die aan de suiker zijn bevestigd, worden vaak genoemd in verwijzing naar de koolstof waaraan ze zijn gebonden. Het fosfaatresidu is bijvoorbeeld gehecht aan het 5'-koolstof van de suiker en de hydroxylgroep is gehecht aan het 3'-koolstofatoom van de suiker. We zullen vaak het koolstofnummer gebruiken om te verwijzen naar functionele groepen op nucleotiden, dus zorg dat je goed bekend bent met de structuur van de pentosesuiker.

De pentosesuiker in DNA wordt deoxyribose genoemd en in RNA is de suiker ribose. Het verschil tussen de suikers is de aanwezigheid van de hydroxylgroep op het 2'-koolstofatoom van de ribose en de afwezigheid ervan op het 2'-koolstofatoom van de deoxyribose. U kunt daarom bepalen of u naar een DNA- of RNA-nucleotide kijkt aan de hand van de aanwezigheid of afwezigheid van de hydroxylgroep op het 2'-koolstofatoom - u zult hier waarschijnlijk bij talloze gelegenheden om worden gevraagd, inclusief examens.

De fosfaatgroep

Er kunnen tussen de één en drie fosfaatgroepen gebonden zijn aan het 5'-koolstofatoom van de suiker. Wanneer één fosfaat is gebonden, wordt het nucleotide a . genoemd Nucleotide monoPfosfaat (NMP). Als twee fosfaten gebonden zijn, wordt het nucleotide aangeduid als: Nucleotide NSlPfosfaat (NDP). Wanneer drie fosfaten aan het nucleotide zijn gebonden, wordt dit a . genoemd Nucleotide triPfosfaat (NTP). De fosfoanhydridebindingen die de fosfaatgroepen met elkaar verbinden, hebben specifieke chemische eigenschappen die ze goed maken voor verschillende biologische functies. De hydrolyse van de bindingen tussen de fosfaatgroepen is thermodynamisch exergoon onder biologische omstandigheden; de natuur heeft talloze mechanismen ontwikkeld om deze negatieve verandering in vrije energie te koppelen om veel reacties in de cel te stimuleren. Figuur 2 toont de structuur van het nucleotide trifosfaat Adenosine Trifosfaat, ATP, dat we in andere hoofdstukken in meer detail zullen bespreken.

Opmerking: "hoge-energetische" obligaties

De term "hoge-energetische binding" wordt VEEL gebruikt in de biologie. Deze term is echter een verbale snelkoppeling die enige verwarring kan veroorzaken. De term verwijst naar de hoeveelheid negatieve vrije energie die gepaard gaat met de hydrolyse van de binding in kwestie. Het water (of een andere gelijkwaardige reactiepartner) levert een belangrijke bijdrage aan de energierekening. In ATP bijvoorbeeld zou het eenvoudigweg "breken" van een fosfoanhydridebinding - zeg maar met een denkbeeldige moleculaire pincet - door een fosfaat af te trekken energetisch niet gunstig zijn. We moeten daarom oppassen dat we niet zeggen dat het verbreken van bindingen in ATP energetisch gunstig is of dat er "energie vrijkomt". In plaats daarvan moeten we specifieker zijn en opmerken dat de hydrolyse van de binding energetisch gunstig is. Een deel van deze veelvoorkomende misvatting houdt naar onze mening verband met het gebruik van de term "hoge-energetische bindingen". Terwijl we in Bis2a hebben geprobeerd het gebruik van de volkstaal "hoge energie" bij het verwijzen naar bindingen te minimaliseren, in plaats daarvan proberen we biochemische reacties te beschrijven door meer specifieke termen te gebruiken, als studenten biologie zul je ongetwijfeld de potentieel misleidende - hoewel weliswaar bruikbare - kortere weg "high energy bond" terwijl je verder gaat met je studie. Houd dus het bovenstaande in gedachten wanneer u leest of luistert naar verschillende discussies in de biologie. Heck, gebruik de term zelf. Zorg ervoor dat u echt begrijpt waar het naar verwijst.

Figuur 2. ATP (adenosinetrifosfaat) heeft drie fosfaatgroepen die kunnen worden verwijderd door hydrolyse om ADP (adenosinedifosfaat) of AMP (adenosinemonofosfaat) te vormen. Naamsvermelding: Marc T. Facciotti (origineel werk)

Dubbele helixstructuur van DNA

DNA heeft een dubbele helixstructuur (hieronder weergegeven) die wordt gecreëerd door twee strengen van covalent gekoppelde nucleotide-subeenheden. De suiker- en fosfaatgroepen van elke streng nucleotiden bevinden zich aan de buitenkant van de helix en vormen de ruggengraat van het DNA (gemarkeerd door de oranje linten in figuur 3). De twee strengen van de helix lopen in tegengestelde richtingen, wat betekent dat het 5'-koolstofuiteinde van de ene streng naar het 3'-koolstofuiteinde van de bijbehorende streng wijst (zie afbeeldingen 4 en 5). We noemden deze oriëntatie van de twee strengen: antiparallel. Merk ook op dat fosfaatgroepen in figuur 3 zijn afgebeeld als oranje en rode "stokjes" die uit het lint steken. De fosfaten zijn bij fysiologische pH's negatief geladen en geven daardoor de ruggengraat van het DNA een sterk lokaal negatief geladen karakter. Daarentegen zijn de stikstofbasen gestapeld in het binnenste van de helix (deze worden weergegeven als groene, blauwe, rode en witte stokken in figuur 3). Nucleotidenparen interageren met elkaar via specifieke waterstofbruggen (getoond in figuur 5). Elk paar is 0,34 nm van het volgende basenpaar in de ladder gescheiden en deze dichte stapeling en vlakke oriëntatie geeft aanleiding tot energetisch gunstige base-stapelinteracties. De specifieke chemie die met deze interacties gepaard gaat, valt buiten de inhoud van Bis2a, maar wordt hier in meer detail beschreven voor de nieuwsgierige of meer gevorderde studenten. We verwachten echter dat studenten zich ervan bewust zijn dat het stapelen van de stikstofbasen bijdraagt ​​aan de stabiliteit van de dubbele helix, en we laten de instructeurs van je hogere divisie genetica en organische chemie de chemische details invullen.

figuur 3. Inheems DNA is een antiparallelle dubbele helix. De fosfaatruggengraat (aangegeven door de gebogen lijnen) bevindt zich aan de buitenkant en de basen aan de binnenkant. Elke base van de ene streng interageert via waterstofbinding met een base van de tegenoverliggende streng. Facciotti (origineel werk)

In een dubbele helix hebben bepaalde combinaties van basenparen chemisch meer de voorkeur dan andere op basis van de typen en locaties van functionele groepen op de stikstofbasen van elk nucleotide. In de biologie vinden we dat:

Adenine (A) is chemisch complementair met thymidine (T) (A paren met T)

en

Guanine (G) is chemisch complementair met cytosine (C) (G paren met C).

We verwijzen vaak naar dit patroon als "base complementariteit" en zeggen dat de antiparallelle strengen zijn complementair naar elkaar. Als de sequentie van één streng bijvoorbeeld van DNA is, is 5'-AATTGGCC-3', dan zou de complementaire streng de sequentie 5'-GGCCAATT-3' hebben.

We kiezen er soms voor om complementaire dubbel-helixstructuren in tekst weer te geven door de complementaire strengen als volgt op elkaar te stapelen:

5' - GGCCAATTCCATACTAGGT - 3'

3' - CCGGTTAAGGTATGATCCA - 5'

Merk op dat elke streng zijn 5'- en 3'-uiteinden heeft gelabeld en dat als men langs elke streng zou lopen vanaf het 5'-uiteinde naar het 3'-uiteinde, dat de bewegingsrichting voor elke streng tegengesteld zou zijn aan de andere; de strengen zijn antiparallel. We zeggen vaak dingen als "van 5-priemgetal naar 3-priemgetal" of "gesynthetiseerd 5-priemgetal naar 3-priemgetal" om te verwijzen naar de richting waarin we een reeks lezen of de richting van synthese. Begin uzelf te wennen aan deze nomenclatuur.

Figuur 4. Paneel A. In een dubbelstrengs DNA-molecuul lopen de twee strengen antiparallel aan elkaar, zodat de ene streng van 5 'naar 3' loopt en de andere van 3' naar 5'. Hier worden de strengen weergegeven als blauwe en groene lijnen die wijzen in de 5' naar 3' oriëntatie. Complementaire basenparing wordt afgebeeld met een horizontale lijn tussen complementaire basen. Paneel B. De twee antiparallelle strengen zijn afgebeeld in dubbele spiraalvorm. Merk op dat de oriëntatie van de strengen nog steeds wordt weergegeven. Merk bovendien op dat de helix rechtshandig is - de "krul" van de helix, afgebeeld in paars, windt in de richting van de vingers van de hand als de rechterhand wordt gebruikt en de richting van de helix wijst naar de duim. Paneel C. Deze weergave toont twee structurele kenmerken die voortkomen uit de assemblage van de twee strengen die de grote en kleine groeven worden genoemd. Deze groeven zijn ook te zien in figuur 3.
Naamsvermelding: Marc T. Facciotti (origineel werk)

Figuur 5. Een ingezoomde weergave op moleculair niveau van de antiparallelle strengen in DNA. In een dubbelstrengs DNA-molecuul lopen de twee strengen antiparallel aan elkaar, zodat de ene streng van 5 'naar 3' loopt en de andere van 3' naar 5'. De fosfaatruggengraat bevindt zich aan de buitenkant en de bases in het midden. Adenine vormt waterstofbruggen (of basenparen) met thymine en guanine basenparen met cytosine.
Naamsvermelding: Marc T. Facciotti (origineel werk)

Functies en rollen van nucleotiden en nucleïnezuren om op te letten in Bis2a

Naast hun structurele rol in DNA en RNA, dienen nucleotiden zoals ATP en GTP ook als mobiele energiedragers voor de cel. Sommige studenten zijn verrast als ze leren begrijpen dat de ATP- en GTP-moleculen die we bespreken in de context van bio-energetica dezelfde zijn als die welke betrokken zijn bij de vorming van nucleïnezuren. We zullen dit in meer detail bespreken wanneer we DNA- en RNA-synthesereacties bespreken. Nucleotiden spelen ook een belangrijke rol als co-factoren in veel enzymatisch gekatalyseerde reacties.

Nucleïnezuren, in het bijzonder RNA, spelen een verscheidenheid aan rollen in het cellulaire proces, naast het zijn van informatieopslagmoleculen. Enkele van de rollen waar u tijdens de cursus op moet letten, zijn: (a) Riboproteïne complexen - RNA-eiwitcomplexen waarin het RNA zowel katalytische als structurele rollen vervult. Voorbeelden van dergelijke complexen omvatten ribosomen (rRNA), RNasen, splicesosoomcomplexen en telomerase. (b) Rollen voor informatieopslag en -overdracht. Deze rollen omvatten moleculen zoals DNA, boodschapper-RNA (mRNA), transfer-RNA (tRNA). (c) Regelgevende rollen. Voorbeelden hiervan zijn verschillende niet-coderende (ncRNA). Wikipedia heeft een uitgebreide samenvatting van de verschillende soorten bekende RNA-moleculen die we aanbevelen om te bladeren om een ​​beter beeld te krijgen van de grote functionele diversiteit van deze moleculen.

Genomen als organische blauwdrukken

Een genoom, niet te verwarren met een kabouter, is de volledige verzameling erfelijke informatie van een organisme die is opgeslagen in DNA. Verschillen in informatie-inhoud helpen om de diversiteit van het leven dat we overal om ons heen zien te verklaren. Veranderingen in de informatie die in het genoom is gecodeerd, zijn de belangrijkste aanjagers van de fenotypische diversiteit die we om ons heen zien (en sommige kunnen we niet) die worden gefilterd door natuurlijke selectie, en ze zijn dus de aanjagers van evolutie. Dit leidt tot vragen. Als elke cel in een meercellig organisme dezelfde DNA-sequentie bevat, hoe kunnen er dan verschillende celtypen zijn (bijvoorbeeld, hoe kan een cel in een lever zo verschillend zijn van een cel in de hersenen als ze allebei hetzelfde DNA dragen)? Hoe lezen we de informatie? Hoe interpreteren we wat we lezen? Hoe begrijpen we hoe alle "delen" die we in het genoom identificeren functioneel met elkaar in verband staan? Hoe is dit alles gerelateerd aan de expressie van eigenschappen? Hoe leiden veranderingen in het genoom tot veranderingen in eigenschappen?

Een genoomsequentie bepalen

De informatie die in genomen is gecodeerd, levert belangrijke gegevens voor het begrijpen van het leven, zijn functies, zijn diversiteit en zijn evolutie. Daarom ligt het voor de hand dat het lezen van de informatie-inhoud die is gecodeerd in het (de) genoom(en) in kwestie, een redelijke plaats is om met biologiestudies te beginnen. Een goed startpunt is het bepalen van de volgorde van nucleotiden (A, G, C, T) en hun organisatie in een of meer onafhankelijk replicerende eenheden van DNA (denk bijvoorbeeld aan chromosomen en/of plasmiden). Meer dan 30 jaar na de ontdekking dat DNA het erfelijke materiaal is, was dit een ontmoedigende propositie. Aan het eind van de jaren tachtig begon echter de komst van semi-geautomatiseerde hulpmiddelen voor DNA-sequencing, en dit begon een revolutie die de manier waarop we de studie van het leven benaderen drastisch heeft veranderd. Twintig jaar later, in het midden van de jaren 2000, kwamen we in een periode van versnelde technologische vooruitgang waarin vooruitgang in materiaalwetenschappen (in het bijzonder vooruitgang in ons vermogen om dingen op zeer kleine schaal te maken), optica, elektrische en computertechniek, bio-engineering, en computerwetenschappen zijn allemaal samengekomen om ons een dramatische toename te brengen in ons vermogen om DNA te sequensen en dienovereenkomstig dramatische dalingen in de kosten van talrijke vorderingen in ons vermogen om DNA te sequensen. Een beroemd voorbeeld om dit punt te illustreren, is het vergelijken van de veranderingen in de kosten om het menselijk genoom te sequensen. Het eerste ontwerp van het menselijk genoom duurde bijna 15 jaar en $ 3 miljard dollar om te voltooien. Tegenwoordig kunnen tientallen menselijke genomen in één dag worden gesequenced op een enkel instrument voor minder dan $ 1000 per stuk (de kosten en tijd blijven afnemen). Tegenwoordig bieden bedrijven als Illumina, Pacific Biosciences, Oxford Nanopore en anderen concurrerende technologieën die de kosten verlagen en het volume, de kwaliteit, de snelheid en de draagbaarheid van DNA-sequencing verhogen.

Een van de zeer opwindende elementen van de DNA-sequencing-revolutie is dat het bijdragen vereist en vereist is van biologen, scheikundigen, materiaalwetenschappers, elektrotechnici, werktuigbouwkundigen, computerwetenschappers en programmeurs, wiskundigen en statistici, productontwikkelaars en vele andere technische deskundigen. De potentiële toepassingen en implicaties van het ontsluiten van barrières voor DNA-sequencing hebben investeerders, zakenmensen, productontwikkelaars, ondernemers, ethici, beleidsmakers en vele anderen ertoe aangezet om nieuwe kansen na te streven en na te denken over hoe deze groeiende technologie het beste en meest verantwoord kan worden gebruikt .

De technologische vooruitgang in genoomsequencing heeft geresulteerd in een virtuele stroom van complete genoomsequenties die worden bepaald en gedeponeerd in openbaar beschikbare databases. Je kunt er veel vinden in het National Center for Biotechnology Information. Het aantal beschikbare, volledig gesequenced genomen loopt in de tienduizenden - meer dan 2.000 eukaryote genomen, meer dan 600 archaeale genomen en bijna 12.000 bacteriële genomen op het moment van dit schrijven. Er zijn nog tienduizenden andere genoomsequencing-projecten in uitvoering. Met zoveel beschikbare genoomsequenties - of binnenkort beschikbaar - kunnen we veel vragen gaan stellen over wat we in deze genomen zien. Welke patronen zijn gemeenschappelijk voor alle genomen? Hoeveel genen worden gecodeerd in genomen? Hoe zijn deze georganiseerd? Hoeveel verschillende soorten functies kunnen we vinden? Wat doen de functies die we vinden? Hoe verschillend zijn de genomen van elkaar? Is er bewijs dat ons kan vertellen hoe genomen evolueren? Laten we een paar van deze vragen kort bekijken.

Diversiteit van genomen

Diversiteit in grootte, aantal genen en chromosomen

Laten we beginnen met het onderzoeken van het bereik van genoomgroottes. In de onderstaande tabel zien we een steekproef van genomen uit de database. We kunnen zien dat de genomen van vrij levende organismen enorm in grootte variëren. Het kleinste bekende genoom is gecodeerd in 580.000 basenparen, terwijl het grootste 150 miljard basenparen is - ter referentie, bedenk dat het menselijk genoom 3,2 miljard basenparen is. Dat is een enorm scala aan maten. Vergelijkbare verschillen in het aantal genen bestaan ​​ook.

Tafel 1. Deze tabel toont enkele genoomgegevens voor verschillende organismen. 2n = diploïde getal. Facciotti (eigen werk)overgenomen van http://book.bionumbers.org/how-big-are-genomes/)

Het onderzoeken van Tabel 1 laat ook zien dat sommige organismen meer dan één chromosoom met zich meedragen. Sommige genomen zijn ook polyploïde, wat betekent dat ze meerdere kopieën van vergelijkbare maar niet identieke (homoloog) kopieën van elk chromosoom. Een diploïde organisme draagt ​​in zijn genoom twee homologe kopieën (meestal één van mama en één van papa) van elk chromosoom. Mensen zijn diploïde. Onze somatische cellen dragen 2 homologe kopieën van 23 chromosomen. We kregen 23 exemplaren van individuele chromosomen van onze moeder en 23 exemplaren van onze vader, voor een totaal van 46. Sommige planten hebben een hogere ploïdie. Een plant met vier homologe kopieën van elk chromosoom wordt bijvoorbeeld genoemd tetraploïde. Een organisme met een enkele kopie van elk chromosoom wordt genoemd haploïde.

Structuur van genomen

Tabel 1 geeft ook aanwijzingen voor andere aandachtspunten. Als we bijvoorbeeld het genoom van de kogelvis vergelijken met het genoom van de chimpansee, merken we op dat ze ongeveer hetzelfde aantal genen coderen (19.000), maar ze doen dit op dramatisch verschillend formaat genomen - respectievelijk 400 miljoen basenparen versus 3,3 miljard basenparen. . Dat houdt in dat het genoom van de kogelvis veel minder ruimte tussen zijn genen moet hebben dan men zou verwachten in het genoom van de chimpansee. Dit is inderdaad het geval, en het verschil in gendichtheid is niet uniek voor deze twee genomen. Als we naar figuur 1 kijken, waarin wordt geprobeerd een deel van het menselijk genoom van 50 kb weer te geven, zien we dat naast de eiwitcoderende regio's (aangegeven in rood en roze) vele andere zogenaamde "kenmerken" kunnen worden uit het genoom lezen. Veel van deze elementen bevatten zeer repetitieve sequenties.

Figuur 1. Deze afbeelding toont een segment van 50 kb van de menselijke β-T-celreceptorlocus op chromosoom 7. Deze afbeelding toont een klein gebied van het menselijk genoom en de soorten "kenmerken" die in het genoom kunnen worden gelezen en gedecodeerd, waaronder: maar ook naast eiwitcoderende sequenties. Rood en roze komen overeen met regio's die coderen voor eiwitten. Andere kleuren vertegenwoordigen verschillende soorten genomische elementen. Facciotti (eigen werk)overgenomen van www.ncbi.nlm.nih.gov/books/NBK21134/)

Als we nu kijken naar welk deel van het hele menselijke genoom elk van deze soorten elementen uitmaakt (zie figuur 2), zien we dat eiwitcoderende genen slechts 48 miljoen uitmaken van de 3,2 miljard basen van het haploïde genoom.

Figuur 2. Deze grafiek laat zien hoe de vele basenparen van DNA in het menselijke haploïde genoom zijn verdeeld over verschillende identificeerbare kenmerken. Merk op dat slechts een klein deel van het genoom direct is geassocieerd met eiwitcoderende regio's. Facciotti (eigen werk)overgenomen uit bronnen vermeld in figuur)

Wanneer we de frequentie van herhalingsregio's versus eiwitcoderende regio's in verschillende soorten onderzoeken, zien we grote verschillen in eiwitcoderende versus niet-coderende regio's.

Figuur 3. Deze figuur toont: Segmenten van 50 kb van verschillende genomen, die de zeer variabele frequentie van herhalende versus eiwitcoderende elementen in verschillende soorten illustreren.
Naamsvermelding: Marc T. Facciotti (eigen werk
overgenomen van www.ncbi.nlm.nih.gov/books/NBK21134/)

Voorgestelde discussie

Stel een hypothese voor waarom je denkt dat sommige genomen meer of minder niet-coderende sequenties hebben.

Dynamiek van genoomstructuur

Genomen veranderen in de loop van de tijd en tal van verschillende soorten gebeurtenissen kunnen hun volgorde veranderen.

1. Mutaties worden ofwel geaccumuleerd tijdens DNA-replicatie of door blootstelling van de omgeving aan chemische mutagenen of straling. Deze veranderingen vinden typisch plaats op het niveau van enkele nucleotiden.
2. Genoom herschikkingen een klasse van grootschalige veranderingen beschrijven die kunnen optreden, waaronder de volgende: (a) deleties - waarbij segmenten van het chromosoom verloren gaan; (b) duplicatie - waarbij gebieden van het chromosoom onbedoeld worden gedupliceerd; (c) inserties - de insertie van genetisch materiaal (merk op dat dit soms wordt verkregen van virussen of de omgeving, en deletie/insertieparen kunnen voorkomen over chromosomen); (d) inversies - waarbij regio's van het genoom binnen hetzelfde chromosoom worden omgedraaid; en (e) translocaties - waarbij segmenten van het chromosoom worden verplaatst (naar een andere plaats in het chromosoom verplaatst).

Deze veranderingen gebeuren met verschillende snelheden, en sommige worden vergemakkelijkt door de activiteit van enzymkatalysatoren (bijv. transposasen).

De studie van genomen

Vergelijkende genomica

Een van de meest voorkomende dingen die u met een verzameling genoomsequenties kunt doen, is de sequenties van meerdere genomen met elkaar te vergelijken. In het algemeen vallen dit soort activiteiten onder de paraplu van een veld genaamd vergelijkende genomica.

Door het genoom van mensen die aan een erfelijke ziekte lijden te vergelijken met het genoom van mensen die er niet aan lijden, kunnen we de genetische basis voor de ziekte blootleggen. Door de geninhoud, volgorde en volgorde van verwante microben te vergelijken, kunnen we de genetische basis vinden waarom sommige microben ziekte veroorzaken terwijl hun naaste neven vrijwel onschadelijk zijn. We kunnen genomen vergelijken om te begrijpen hoe een nieuwe soort is geëvolueerd. Er zijn veel mogelijke analyses! De basis van deze analyses is vergelijkbaar: zoek naar verschillen over meerdere genomen en probeer die verschillen te associëren met verschillende eigenschappen of gedragingen in die organismen.

Ten slotte vergelijken sommige mensen genoomsequenties om de evolutionaire geschiedenis van de organismen te begrijpen. Meestal resulteren dit soort vergelijkingen in een grafiek die bekend staat als een fylogenetische boom, een grafisch model van de evolutionaire relatie tussen de verschillende soorten die worden vergeleken. Dit veld heet, niet verrassend, fylogenomie.

Metagenomics: wie woont ergens en wat doen ze?

Naast het bestuderen van de genomen van individuele soorten, maken de steeds krachtiger wordende DNA-sequencing-technologieën het mogelijk om tegelijkertijd de genomen te sequensen van omgevingsmonsters die door veel verschillende soorten worden bewoond. Dit veld heet metagenomica. Deze studies zijn meestal gericht op het proberen te begrijpen welke microbiële soorten in verschillende omgevingen leven. Er is grote belangstelling voor het gebruik van DNA-sequencing om de populaties van microben in de darm te bestuderen en om te kijken hoe de populatie verandert als reactie op verschillende diëten, om te zien of er een verband is tussen de overvloed aan verschillende microben en verschillende ziekten, of om te kijken voor de aanwezigheid van ziekteverwekkers. Mensen gebruiken DNA-sequencing van metagenomische omgevingsmonsters om te onderzoeken welke microben in verschillende omgevingen op aarde leven (van de diepzee, tot bodem, tot lucht, tot hyperzoute vijvers, tot kattenuitwerpselen, tot enkele van de gemeenschappelijke oppervlakken die we elke dag aanraken).

Naast het ontdekken "wie waar woont", kan de sequencing van microbiële populaties in verschillende omgevingen ook onthullen welke eiwitcoderende genen in een omgeving aanwezig zijn. Dit kan onderzoekers aanwijzingen geven over welke metabolische activiteiten in die omgeving kunnen plaatsvinden. Naast het verstrekken van belangrijke informatie over wat voor soort chemie in een specifieke omgeving kan plaatsvinden, kan de catalogus van genen die wordt verzameld ook dienen als een belangrijke bron voor de ontdekking van nieuwe enzymen voor toepassingen in de biotechnologie.


Lesmateriaal

Onderwerpen:
Cursusintroductie, Scheve doelen en verwachtingen, Biologie is een informatiewetenschap, Geschiedenis van Bio-informatica, Soorten gegevens, Toepassingsgebieden en introductie tot aankomende cursussegmenten, Introducties van 30 seconden voor studenten, Inleiding tot NCBI & EBI-bronnen voor het moleculaire domein van bio-informatica, Hands-on sessie met behulp van NCBI-BLAST, Entrez, GENE, UniProt, Muscle en PDB bioinformatica tools en databases.

  • Begrijp de toenemende noodzaak van berekeningen in modern life sciences-onderzoek.
  • Maak kennis met hoe bio-informatica wordt beoefend.
  • Begrijp de reikwijdte, verwachtingen, logistiek en ethische code van de cursus.
  • Het doel van de hands-on sessie is om een ​​reeks bioinformatica-kerndatabases en bijbehorende onlinediensten te introduceren, terwijl actief de moleculaire basis van verschillende veelvoorkomende ziekten bij de mens wordt onderzocht.
  • Vul de enquête voorafgaand aan de cursus in.
  • Stel uw laptopcomputer in voor deze cursus.
  • Ontvang een kopie van de cursussyllabus,
  • Vul het aanmeldingsformulier kantooruren in.

Schermcasts:

1 Welkom bij BGGN-213: Cursus introductie en logistiek.


2 Wat is bio-informatica? Bio-informatica kan voor verschillende mensen verschillende dingen betekenen. Wat gaan we eigenlijk leren in deze les?


3 Hoe doen we aan bio-informatica? Sommige elementaire bio-informatica kunnen online of met gedownloade tools worden gedaan. Meestal hebben we echter een gespecialiseerde rekenopstelling nodig.


2: Grondbeginselen, algoritmen en toepassingen van sequentie-uitlijning

Onderwerpen:
Verdere dekking van belangrijke NCBI- en EBI-bronnen voor het moleculaire domein van bioinformatica met een focus op GenBank, UniProt, Entrez en Gene Ontology. Er zijn veel bioinformatica-databases (zie hand-out) en het is belangrijk om het nut en de kwaliteit ervan te kunnen beoordelen. Sequentie-uitlijning en database zoeken: Homologie, Sequentieovereenkomst, Lokale en globale uitlijning, Heuristische benaderingen, Database zoeken met BLAST, E-waarden en evaluatie van uitlijningsscores en statistieken.

  • In staat zijn om de gegevens in belangrijke bioinformatica-databases (GenBank, GENE, UniProt, PFAM, OMIM, PDB) te doorzoeken, zoeken, vergelijken en contrasteren en te beschrijven hoe deze databases elkaar kruisen.
  • Kunnen beschrijven hoe nucleotide- en eiwitsequentie- en structuurgegevens worden weergegeven (FASTA, FASTQ, GenBank, UniProt, PDB).
  • In staat zijn om te beschrijven hoe dynamisch programmeren werkt voor paarsgewijze sequentie-uitlijning
  • Waardeer de verschillen tussen globale en lokale afstemming samen met hun belangrijkste toepassingsgebieden.
  • Begrijp hoe het afstemmen van nieuwe sequenties op eerder gekarakteriseerde genen of eiwitten belangrijke inzichten verschaft in hun gemeenschappelijke kenmerken en evolutionaire oorsprong.
  • De doelen van de hands-on sessie zijn het verkennen van de principes die ten grondslag liggen aan de computationele tools die kunnen worden gebruikt om sequentie-uitlijningen te berekenen en te evalueren.

Sectie 2. Het GenomicDataCommons R-pakket

Het GenomicDataCommons Bioconductor-pakket biedt functies voor het opvragen, openen en ontginnen van de NCI-GDC in R. Door dit pakket te gebruiken, kunnen we grote kankergenomics-datasets (bijvoorbeeld de werkelijke RNA-Seq-, WXS- of SNP-gegevens) rechtstreeks aan de overvloed koppelen van state-of-the-art bio-informatica-methoden die beschikbaar zijn in R. Dit is belangrijk omdat het zowel gerichte als verkennende analyse van moleculaire kankergegevens aanzienlijk vergemakkelijkt, veel verder dan wat toegankelijk is via een webportaal.

Deze sectie laat zien hoe men de GenomicDataCommons en maftools bioconductor-pakketten kan koppelen om snel inzicht te krijgen in openbare kankergenomics-datasets.

We zullen eerst functies uit het GenomicDataCommons-pakket gebruiken om somatische variantresultaten van de NCI-GDC te identificeren en vervolgens op te halen en vervolgens een beoordeling op hoog niveau van die varianten bieden met behulp van het maftools-pakket. Het latere pakket werkt met Mutation Annotation Format of MAF formaatbestanden die door GDC en anderen worden gebruikt om somatische varianten op te slaan.



Opmerkingen:

  1. Faer

    You are distanced from the conversation

  2. Turg

    Ik denk dat je niet gelijk hebt. We zullen het bespreken.

  3. Amycus

    Hoera!!!! Die van ons is verlopen :)

  4. Khairy

    Keuze bij u ongemakkelijk

  5. Arashilrajas

    Het is naar mijn mening duidelijk. Ik wilde dit onderwerp niet ontwikkelen.



Schrijf een bericht