Gene - Gene

Billedet ovenfor indeholder links, der kan klikkes på
Et gen er en region af DNA, der koder for funktion. Et kromosom består af en lang DNA -streng, der indeholder mange gener. Et menneskeligt kromosom kan have op til 500 millioner basepar DNA med tusinder af gener.

I biologien er et gen (fra genos ( græsk ), der betyder generation eller fødsel eller køn ) en grundlæggende enhed for arvelighed og en sekvens af nukleotider i DNA, der koder for syntesen af et genprodukt , enten RNA eller protein .

Under genekspression kopieres DNA'et først til RNA . RNA'et kan være direkte funktionelt eller være den mellemliggende skabelon for et protein, der udfører en funktion. Overførsel af gener til en organismes afkom er grundlaget for arv af fænotypiske træk . Disse gener udgør forskellige DNA -sekvenser kaldet genotyper . Genotyper sammen med miljø- og udviklingsfaktorer bestemmer, hvad fænotyperne vil være. De fleste biologiske træk er påvirket af polygener (mange forskellige gener) samt gen -miljø -interaktioner . Nogle genetiske træk er øjeblikkeligt synlige, såsom øjenfarve eller antallet af lemmer, og nogle er ikke, f.eks. Blodtype , risiko for specifikke sygdomme eller tusinder af grundlæggende biokemiske processer, der udgør liv .

Gener kan erhverve mutationer i deres sekvens, hvilket fører til forskellige varianter, kendt som alleler , i befolkningen . Disse alleler koder for lidt forskellige versioner af et protein, som forårsager forskellige fænotypiske træk. Anvendelse af udtrykket "at have et gen" (f.eks. "Gode gener", "hårfarvegen") refererer typisk til at indeholde en anden allel af det samme, delte gen. Gener udvikler sig på grund af naturlig selektion / overlevelse af de stærkeste og genetiske drift af allelerne.

Begrebet gen fortsætter med at blive forfinet, efterhånden som nye fænomener opdages. For eksempel kan regulerende regioner i et gen være langt væk fra dets kodende områder , og kodende regioner kan opdeles i flere exoner . Nogle vira gemmer deres genom i RNA i stedet for DNA, og nogle genprodukter er funktionelle ikke-kodende RNA'er . Derfor er en bred, moderne arbejdsdefinition af et gen ethvert diskret sted for arvelig, genomisk sekvens, der påvirker en organismes egenskaber ved at blive udtrykt som et funktionelt produkt eller ved regulering af genekspression .

Begrebet gen blev introduceret af den danske botaniker , plantefysiolog og genetiker Wilhelm Johannsen i 1909. Det er inspireret af den antikke græske : γόνος, gonos , det betyder afkom og formering.

Historie

Foto af Gregor Mendel
Gregor Mendel

Opdagelse af diskrete arvede enheder

Eksistensen af ​​diskrete arvelige enheder blev først foreslået af Gregor Mendel (1822–1884). Fra 1857 til 1864 studerede han i Brno , det østrigske imperium (nutidens Tjekkiet) arvsmønstre i 8000 almindelige spiselige ærteplanter og sporede forskellige træk fra forælder til afkom. Han beskrev disse matematisk som 2 n  kombinationer, hvor n er antallet af forskellige egenskaber i de originale ærter. Selvom han ikke brugte udtrykket gen , forklarede han sine resultater i form af diskrete arvelige enheder, der giver anledning til observerbare fysiske egenskaber. Denne beskrivelse præfigurerede Wilhelm Johannsens sondring mellem genotype (genetisk materiale af en organisme) og fænotype (den observerbare egenskab ved denne organisme). Mendel var også den første til at demonstrere uafhængigt sortiment , sondringen mellem dominerende og recessive træk, sondringen mellem en heterozygot og homozygote og fænomenet diskontinuerlig arv.

Før Mendels arbejde var den dominerende teori om arvelighed en blanding af arv , hvilket foreslog, at hver forælder bidrog med væske til befrugtningsprocessen, og at forældrenes egenskaber blandede og blandede sig for at producere afkommet. Charles Darwin udviklede en arvsteori , han kaldte pangenesis , fra græsk pan ("alt, hel") og genesis ("fødsel") / genos ("oprindelse"). Darwin brugte udtrykket gemmule til at beskrive hypotetiske partikler, der ville blandes under reproduktion.

Mendels arbejde gik stort set ubemærket hen efter det første udgivelse i 1866, men blev genopdaget i slutningen af ​​1800 -tallet af Hugo de Vries , Carl Correns og Erich von Tschermak , der (påstået at have) nået lignende konklusioner i deres egen forskning. Specifikt i 1889 udgav Hugo de Vries sin bog Intracellular Pangenesis , hvor han postulerede, at forskellige karakterer har individuelle arvelige bærere, og at arv af specifikke træk i organismer kommer i partikler. De Vries kaldte disse enheder for "pangenes" ( Pangens på tysk) efter Darwins pangeneseteori fra 1868.

Tyve år senere, i 1909, introducerede Wilhelm Johannsen udtrykket 'gen' og i 1906, William Bateson , ' genetik ', mens Eduard Strasburger blandt andre stadig brugte udtrykket 'pangene' om den grundlæggende fysiske og funktionelle arvelige enhed .

Opdagelse af DNA

Fremskridt med at forstå gener og arv fortsatte gennem det 20. århundrede. Deoxyribonukleinsyre (DNA) viste sig at være det molekylære opbevaringssted for genetisk information ved forsøg i 1940'erne til 1950'erne. Strukturen af ​​DNA blev undersøgt af Rosalind Franklin og Maurice Wilkins ved hjælp af røntgenkrystallografi , hvilket fik James D. Watson og Francis Crick til at offentliggøre en model af det dobbeltstrengede DNA-molekyle, hvis parrede nukleotidbaser indikerede en overbevisende hypotese om mekanismen for genetisk replikation.

I begyndelsen af ​​1950'erne var den fremherskende opfattelse, at generne i et kromosom virkede som adskilte enheder, udelelige ved rekombination og arrangeret som perler på en snor. Forsøgene med Benzer med mutanter defekte i rII -regionen i bakteriofag T4 (1955-1959) viste, at individuelle gener har en simpel lineær struktur og sandsynligvis svarer til en lineær sektion af DNA.

Tilsammen etablerede denne forskningsgruppe det centrale dogme i molekylærbiologi , der siger, at proteiner oversættes fra RNA , som transkriberes fra DNA . Dette dogme har siden vist sig at have undtagelser, såsom omvendt transkription i retrovira . Den moderne undersøgelse af genetik på DNA -niveau er kendt som molekylær genetik .

I 1972 var Walter Fiers og hans team de første til at bestemme sekvensen af ​​et gen: sekvensen af Bacteriophage MS2 coat protein. Den efterfølgende udvikling af kædetermineret DNA-sekventering i 1977 af Frederick Sanger forbedrede effektiviteten af ​​sekventering og gjorde det til et rutinemæssigt laboratorieværktøj. En automatiseret version af Sanger -metoden blev brugt i de tidlige faser af Human Genome Project .

Moderne syntese og dens efterfølgere

Teorierne udviklet i begyndelsen af ​​det 20. århundrede for at integrere mendelsk genetik med darwinistisk udvikling kaldes den moderne syntese , et begreb introduceret af Julian Huxley .

Evolutionære biologer har efterfølgende ændret dette koncept, såsom George C. Williams ' gen-centrerede syn på evolution . Han foreslog et evolutionært begreb om genet som en enhed for naturlig selektion med definitionen: "det, der adskiller og rekombinerer med mærkbar frekvens." I denne opfattelse transskriberer det molekylære gen som en enhed, og det evolutionære gen arver som en enhed. Relaterede ideer, der understregede generernes centralitet i evolution, blev populær af Richard Dawkins .

Molekylær basis

DNA-kemisk strukturdiagram, der viser, hvordan den dobbelte helix består af to kæder af sukker-fosfat-rygrad med baser, der peger indad og specifikt baseparring A til T og C til G med hydrogenbindinger.
Den kemiske struktur af et fire basepar fragment af en DNA dobbelt helix . De sukker - phosphat skeletkæder løber i modsatte retninger med baser peger indad, basepardannende A til T og C til G med hydrogenbindinger .

DNA

Langt de fleste organismer koder deres gener i lange DNA -strenge (deoxyribonukleinsyre). DNA består af en kæde, der består af fire typer nukleotidunderenheder , der hver består af: et sukker med fem kulstof ( 2-deoxyribose ), en fosfatgruppe og en af ​​de fire baser adenin , cytosin , guanin og thymin .

To kæder af DNA twist omkring hinanden til dannelse af en DNA dobbelt helix med phosphat-sukker rygrad spiral omkring ydersiden, og de baser, der peger indad med adenin baseparring til thymin og guanin til cytosin. Specificiteten af ​​baseparring opstår, fordi adenin og thymin flugter for at danne to hydrogenbindinger , mens cytosin og guanin danner tre hydrogenbindinger. De to tråde i en dobbelt helix skal derfor være komplementære , idet deres sekvens af baser matcher sådan, at adeninerne i den ene streng er parret med thyminerne i den anden streng osv.

På grund af den kemiske sammensætning af pentoseresterne i baserne har DNA -tråde retning. Den ene ende af en DNA -polymer indeholder en udsat hydroxylgruppedeoxyribosen ; dette er kendt som 3' -enden af molekylet. Den anden ende indeholder en udsat phosphatgruppe ; dette er 5' -enden . De to tråde af en dobbelt-helix løber i modsatte retninger. Nukleinsyresyntese, herunder DNA -replikation og transkription forekommer i 5 '→ 3' -retningen, fordi nye nukleotider tilføjes via en dehydratiseringsreaktion, der bruger det udsatte 3' -hydroxyl som nukleofil .

Den ekspression af gener kodet i DNA begynder med at transkribere genet i RNA , en anden type af nukleinsyre, som er meget lig DNA, men hvis monomerer indeholder sukkeret ribose stedet deoxyribose . RNA indeholder også base uracil i stedet for thymin . RNA-molekyler er mindre stabile end DNA og er typisk enkeltstrengede. Gener, der koder for proteiner, består af en række tre- nukleotidsekvenser kaldet kodoner , der fungerer som "ord" i det genetiske "sprog". Den genetiske kode angiver korrespondancen under proteinoversættelse mellem kodoner og aminosyrer . Den genetiske kode er næsten den samme for alle kendte organismer.

Kromosomer

Et mikroskopibillede af 46 kromosomer stribet med røde og grønne bånd
Fluorescerende mikroskopibillede af en human kvindelig karyotype , der viser 23 par kromosomer. DNA'et er farvet rødt, med områder rige på husholdningsgener yderligere farvet i grønt. De største kromosomer er omkring 10 gange størrelsen af ​​de mindste.

Det samlede komplement af gener i en organisme eller celle er kendt som dets genom , som kan lagres på et eller flere kromosomer . Et kromosom består af en enkelt, meget lang DNA -helix, hvorpå tusinder af gener er kodet. Regionen af ​​kromosomet, hvor et bestemt gen er placeret, kaldes dets locus . Hvert locus indeholder en allel af et gen; medlemmer af en befolkning kan imidlertid have forskellige alleler på locus, hver med en lidt anden gensekvens.

Størstedelen af eukaryote gener er lagret på et sæt store, lineære kromosomer. Kromosomerne er pakket inde i kernen i kompleks med lagringsproteiner kaldet histoner for at danne en enhed kaldet et nukleosom . DNA pakket og kondenseret på denne måde kaldes kromatin . Den måde, hvorpå DNA opbevares på histonerne, samt kemiske modifikationer af selve histonen, regulerer, om en bestemt region af DNA er tilgængelig for genekspression . Ud over gener indeholder eukaryote kromosomer sekvenser, der er involveret i at sikre, at DNA'et kopieres uden nedbrydning af endeområder og sorteres i datterceller under celledeling: replikationsoprindelse , telomerer og centromeren . Replikationens oprindelse er sekvensområderne, hvor DNA -replikation initieres for at lave to kopier af kromosomet. Telomerer er lange strækninger af gentagne sekvenser, der dækker enderne af de lineære kromosomer og forhindrer nedbrydning af kodende og regulerende regioner under DNA -replikation . Telomerernes længde falder hver gang genomet replikeres og har været impliceret i aldringsprocessen . Centromeren er nødvendig for at binde spindelfibre til at adskille søsterkromatider i datterceller under celledeling .

Prokaryoter ( bakterier og archaea ) gemmer typisk deres genomer på et enkelt stort, cirkulært kromosom . På samme måde indeholder nogle eukaryote organeller et resterende cirkulært kromosom med et lille antal gener. Prokaryoter supplerer undertiden deres kromosom med yderligere små cirkler af DNA kaldet plasmider , som normalt kun koder for få gener og kan overføres mellem individer. For eksempel kodes generne for antibiotikaresistens normalt på bakterielle plasmider og kan passeres mellem individuelle celler, selv dem af forskellige arter, via vandret genoverførsel .

Mens kromosomerne i prokaryoter er relativt gentætte, indeholder eukaryotes ofte områder af DNA, der ikke tjener nogen åbenbar funktion. Enkle encellede eukaryoter har relativt små mængder af sådant DNA, hvorimod genomerne af komplekse flercellede organismer , herunder mennesker, indeholder et absolut flertal af DNA uden en identificeret funktion. Dette DNA er ofte blevet omtalt som " uønsket DNA ". Nyere analyser tyder imidlertid på, at selvom proteinkodende DNA kun udgør 2% af det humane genom , kan omkring 80% af baserne i genomet udtrykkes, så udtrykket "uønsket DNA" kan være en forkert betegnelse.

Struktur og funktion

Struktur

Billedet ovenfor indeholder links, der kan klikkes på
Strukturen af ​​et eukaryotisk proteinkodende gen. Den regulatoriske sekvens styrer, hvornår og hvor ekspression forekommer for det proteinkodende område (rødt). Promoter- og forstærkerregioner (gul) regulerer transskriptionen af genet til et præ-mRNA, som modificeres for at fjerne introner (lysegrå) og tilføjer en 5'-hætte og poly-A-hale (mørkegrå). De mRNA 5 ' og 3' uoversatte regioner (blå) regulerer translation til det endelige proteinprodukt.

Den struktur af et gen består af mange elementer, som den faktiske proteinkodende sekvens ofte kun er en lille del. Disse inkluderer DNA -regioner, der ikke er transskriberet såvel som utranslaterede områder af RNA.

Flankerer den åbne læseramme, gener indeholder en regulatorisk sekvens, der er nødvendig for deres ekspression. For det første kræver gener en promotorsekvens . Promotoren genkendes og bindes af transkriptionsfaktorer, der rekrutterer og hjælper RNA -polymerase med at binde til regionen for at starte transkription. Genkendelsen sker typisk som en konsensus -sekvens som TATA -boksen . Et gen kan have mere end en promotor, hvilket resulterer i messenger -RNA'er ( mRNA ), der er forskellige i, hvor langt de strækker sig i 5' -enden. Højt transskriberede gener har "stærke" promotorsekvenser, der danner stærke associationer med transkriptionsfaktorer, og derved initierer transkription med en høj hastighed. Andre gener har "svage" promotorer, der danner svage associationer med transkriptionsfaktorer og initierer transkription sjældnere. Eukaryote promotorregioner er meget mere komplekse og vanskelige at identificere end prokaryote promotorer.

Derudover kan gener have regulerende regioner mange kilobaser opstrøms eller nedstrøms for den åbne læseramme, der ændrer udtryk. Disse virker ved at binde til transkriptionsfaktorer, som derefter får DNA til at sløjfe, så den regulatoriske sekvens (og bundne transkriptionsfaktor) bliver tæt på RNA -polymerasebindingsstedet. F.eks. Øger enhancere transkription ved at binde et aktivatorprotein , som derefter hjælper med at rekruttere RNA -polymerasen til promotoren; omvendt binder lyddæmpere repressorproteiner og gør DNA'et mindre tilgængeligt for RNA -polymerase.

Det transkriberede præ-mRNA indeholder utranslaterede regioner i begge ender, som indeholder bindingssteder for ribosomer , RNA-bindende proteiner , miRNA , såvel som terminator , og start- og stopkodoner . Derudover indeholder de fleste eukaryote åbne læserammer utranslaterede introner , som fjernes og exoner , som er forbundet sammen i en proces kendt som RNA -splejsning . Endelig er enderne af gentranskripter defineret ved spaltning og polyadenylering (CPA) -steder , hvor nyproduceret pre-mRNA bliver spaltet, og en streng på ~ 200 adenosinmonophosphater tilsættes i 3'-enden. Den poly (A) hale beskytter modent mRNA mod nedbrydning og har andre funktioner, der påvirker oversættelse, lokalisering, og transport af transkriptet fra kernen. Splejsning, efterfulgt af CPA, genererer det endelige modne mRNA , som koder for proteinet eller RNA -produktet. Selvom de generelle mekanismer, der definerer placeringer af menneskelige gener, er kendt, er identifikation af de nøjagtige faktorer, der regulerer disse cellulære processer, et område med aktiv forskning. For eksempel kan kendte sekvensegenskaber i 3′-UTR kun forklare halvdelen af ​​alle humane genender.

Mange prokaryote gener er organiseret i operoner , med flere proteinkodende sekvenser, der transkriberes som en enhed. Generne i en operon transkriberes som et kontinuerligt messenger -RNA , omtalt som et polycistronisk mRNA . Udtrykket cistron svarer i denne sammenhæng til gen. Transkriptionen af ​​en operons mRNA styres ofte af en repressor, der kan forekomme i en aktiv eller inaktiv tilstand afhængigt af tilstedeværelsen af ​​specifikke metabolitter. Når den er aktiv, binder repressoren til en DNA -sekvens i begyndelsen af ​​operonen, kaldet operatørregionen , og undertrykker transskription af operonen ; når repressoren er inaktiv kan transskription af operonen forekomme (se f.eks. Lac operon ). Produkterne af operongener har typisk relaterede funktioner og er involveret i det samme regulatoriske netværk .

Funktionelle definitioner

Det er vanskeligt at definere præcist, hvilket afsnit af en DNA -sekvens der omfatter et gen. Regulerende områder af et gen, såsom enhancere, behøver ikke nødvendigvis at være tæt på den kodende sekvens på det lineære molekyle, fordi det mellemliggende DNA kan sløjfes for at bringe genet og dets regulatoriske område i nærheden. På samme måde kan et gens introner være meget større end dets exoner. Regulerende regioner kan endda være på helt forskellige kromosomer og operere i trans for at tillade regulatoriske områder på et kromosom at komme i kontakt med målgener på et andet kromosom.

Tidligt arbejde inden for molekylær genetik foreslog konceptet om, at et gen danner et protein . Dette koncept (oprindeligt kaldet den ene gen-et-enzymhypotese ) opstod fra et indflydelsesrig papir fra 1941 af George Beadle og Edward Tatum om forsøg med mutanter af svampen Neurospora crassa . Norman Horowitz , en tidlig kollega inden for Neurospora -forskningen, mindede i 2004 om, at "disse eksperimenter grundlagde videnskaben om, hvad Beadle og Tatum kaldte biokemisk genetik . I virkeligheden viste de sig at være åbningspistolen i det, der blev til molekylær genetik og al den udvikling, der er fulgt heraf. ” Det ene gen-et-protein-koncept er blevet forfinet siden opdagelsen af ​​gener, der kan kode flere proteiner ved alternative splejsnings- og kodningssekvenser opdelt i en kort sektion på tværs af genomet, hvis mRNA'er er sammenkædet af trans-splejsning .

En bred operationel definition bruges undertiden til at omfatte kompleksiteten af ​​disse forskellige fænomener, hvor et gen defineres som en forening af genomiske sekvenser, der koder for et sammenhængende sæt potentielt overlappende funktionelle produkter. Denne definition kategoriserer gener efter deres funktionelle produkter (proteiner eller RNA) frem for deres specifikke DNA-loci, med regulatoriske elementer klassificeret som genassocierede regioner.

Overlapning mellem gener

Det er også muligt for gener at overlappe den samme DNA -sekvens og betragtes som adskilte, men overlappende gener . Den nuværende definition af et overlappende gen er forskelligt på tværs af eukaryoter, prokaryoter og vira. I eukaryoter er de for nylig blevet defineret som "når mindst ét ​​nukleotid deles mellem de yderste grænser for de primære transkripter for to eller flere gener, således at en DNA -basemutation på overlapningspunktet vil påvirke transkripter af alle gener, der er involveret i overlapning. " I prokaryoter og virus er de for nylig blevet defineret som "når de kodende sekvenser af to gener deler et nukleotid enten på de samme eller modsatte tråde."

Genudtryk

I alle organismer kræves to trin for at læse de oplysninger, der er kodet i et genet's DNA og producere det protein, det specificerer. For det første transkriberes genet's DNA til messenger -RNA ( mRNA ). For det andet, at mRNA oversættes til protein. RNA-kodende gener skal stadig gennemgå det første trin, men oversættes ikke til protein. Processen med at producere et biologisk funktionelt molekyle af enten RNA eller protein kaldes genekspression , og det resulterende molekyle kaldes et genprodukt .

Genetisk kode

Et RNA -molekyle bestående af nukleotider.  Grupper på tre nukleotider er angivet som kodoner, der hver svarer til en specifik aminosyre.
Skematisk af et enkeltstrenget RNA-molekyle, der illustrerer en række trebaserede kodoner . Hvert tre- nukleotidkodon svarer til en aminosyre, når det oversættes til protein

Nukleotidsekvensen af ​​et gens DNA specificerer aminosyresekvensen for et protein gennem den genetiske kode . Sæt med tre nukleotider, kendt som kodoner , svarer hver til en bestemt aminosyre. Princippet om, at tre sekventielle baser af DNA -kode for hver aminosyre blev demonstreret i 1961 ved anvendelse af rammeskiftmutationer i rIIB -genet i bakteriofag T4 (se Crick, Brenner et al. Eksperiment ).

Derudover angiver et " startkodon " og tre " stopkodoner " begyndelsen og slutningen af ​​det proteinkodende område . Der er 64 mulige kodoner (fire mulige nukleotider i hver af tre positioner, derfor 4 3  mulige kodoner) og kun 20 standard aminosyrer; derfor er koden overflødig, og flere kodoner kan angive den samme aminosyre. Korrespondancen mellem kodoner og aminosyrer er næsten universel blandt alle kendte levende organismer.

Transskription

Transkription producerer et enkeltstrenget RNA- molekyle kendt som messenger-RNA , hvis nukleotidsekvens er komplementær til DNA'et, hvorfra det blev transskriberet. MRNA fungerer som et mellemprodukt mellem DNA -genet og dets endelige proteinprodukt. Genets DNA bruges som en skabelon til at generere et komplementært mRNA. MRNA matcher sekvensen af ​​genets DNA -kodende streng, fordi det syntetiseres som komplementet til templatstrengen . Transkription udføres af et enzym kaldet en RNA -polymerase , som læser skabelonstrengen i 3 ' til 5'  -retningen og syntetiserer RNA'et fra 5' til 3 ' . For at starte transkription genkender og binder polymerasen først en promotorregion af genet. En vigtig mekanisme for genregulering er således blokering eller sekvestering af promotorregionen, enten ved tæt binding af repressormolekyler , der fysisk blokerer polymerasen eller ved at organisere DNA'et, så promotorregionen ikke er tilgængelig.

I prokaryoter forekommer transkription i cytoplasmaet ; for meget lange transkripter kan oversættelse begynde ved 5' -enden af ​​RNA'et, mens 3' -enden stadig transskriberes. I eukaryoter forekommer transkription i kernen, hvor cellens DNA er lagret. RNA-molekylet produceret af polymerasen er kendt som det primære transkript og undergår post-transkriptionelle ændringer, før det eksporteres til cytoplasma til translation. En af de udførte ændringer er splejsning af introner, som er sekvenser i det transkriberede område, der ikke koder for et protein. Alternative splejsningsmekanismer kan resultere i, at modne transkripter fra det samme gen har forskellige sekvenser og dermed koder for forskellige proteiner. Dette er en vigtig form for regulering i eukaryote celler og forekommer også i nogle prokaryoter.

Oversættelse

Et proteinkodende gen i DNA, der transkriberes og translateres til et funktionelt protein eller et ikke-proteinkodende gen, der transkriberes til et funktionelt RNA
Proteinkodende gener transkriberes til et mRNA -mellemprodukt og translateres derefter til et funktionelt protein . RNA-kodende gener transkriberes til et funktionelt ikke-kodende RNA . ( PDB : 3BSE , 1OBB , 3TRA )

Oversættelse er den proces, ved hvilken et modent mRNA -molekyle bruges som en skabelon til syntetisering af et nyt protein . Oversættelse udføres af ribosomer , store komplekser af RNA og protein, der er ansvarlige for at udføre de kemiske reaktioner for at tilføje nye aminosyrer til en voksende polypeptidkæde ved dannelse af peptidbindinger . Den genetiske kode læses tre nukleotider ad gangen, i enheder kaldet codons , via interaktioner med specialiserede RNA -molekyler kaldet transfer RNA (tRNA). Hvert tRNA har tre uparede baser kendt som anticodon, der er komplementære til det codon, det læser på mRNA. TRNA'et er også kovalent bundet til aminosyren specificeret af det komplementære kodon. Når tRNA'et binder til sit komplementære codon i en mRNA -streng, knytter ribosomet sin aminosyrelast til den nye polypeptidkæde, som syntetiseres fra aminoterminal til carboxylterminus . Under og efter syntese skal de fleste nye proteiner foldes til deres aktive tredimensionelle struktur, før de kan udføre deres cellulære funktioner.

Regulering

Gener er reguleret, så de kun udtrykkes , når produktet er nødvendigt, da udtryk trækker på begrænsede ressourcer. En celle regulerer sit genekspression afhængigt af dets ydre miljø (f.eks. Tilgængelige næringsstoffer , temperatur og andre belastninger ), dets indre miljø (f.eks. Celledelingscyklus , metabolisme , infektionsstatus ) og dens specifikke rolle, hvis den er i en flercellet organisme. Genekspression kan reguleres på ethvert trin: fra transkriptionel initiering til RNA-behandling til post-translationel modifikation af proteinet. Reguleringen af laktosemetabolismegener i E. coli ( lac operon ) var den første sådan mekanisme, der blev beskrevet i 1961.

RNA -gener

Et typisk proteinkodende gen kopieres først til RNA som et mellemprodukt i fremstillingen af ​​det endelige proteinprodukt. I andre tilfælde er RNA -molekylerne de faktiske funktionelle produkter, som ved syntesen af ribosomalt RNA og transfer -RNA . Nogle RNA'er kendt som ribozymer er i stand til enzymatisk funktion , og mikroRNA har en regulerende rolle. De DNA- sekvenser, hvorfra sådanne RNA'er transkriberes, er kendt som ikke-kodende RNA-gener .

Nogle vira gemmer hele deres genomer i form af RNA og indeholder slet ikke DNA. Fordi de bruger RNA til at lagre gener, kan deres cellulære værter syntetisere deres proteiner, så snart de er inficeret og uden forsinkelse i at vente på transkription. På den anden side kræver RNA -retrovira , såsom HIV , omvendt transkription af deres genom fra RNA til DNA, før deres proteiner kan syntetiseres. RNA-medieret epigenetisk arv er også blevet observeret i planter og meget sjældent hos dyr.

Arv

Illustration af autosomal recessiv arv.  Hver forælder har en blå allel og en hvid allel.  Hver af deres 4 børn arver en allel fra hver forælder, således at et barn ender med to blå alleler, et barn har to hvide alleler, og to børn har en af ​​hver allel.  Kun barnet med begge blå alleler viser egenskaben, fordi egenskaben er recessiv.
Arv af et gen, der har to forskellige alleler (blå og hvid). Genet er placeret på et autosomalt kromosom . Den hvide allel er recessiv for den blå allel. Sandsynligheden for hvert udfald i børnenes generation er en fjerdedel eller 25 procent.

Organismer arver deres gener fra deres forældre. Aseksuelle organismer arver ganske enkelt en komplet kopi af deres forælders genom. Seksuelle organismer har to kopier af hvert kromosom, fordi de arver et komplet sæt fra hver forælder.

Mendelsk arv

Ifølge mendelsk arv skyldes variationer i en organismes fænotype (observerbare fysiske og adfærdsmæssige egenskaber) til dels variationer i dets genotype (bestemt sæt gener). Hvert gen angiver en bestemt egenskab med en anden sekvens af et gen ( alleler ), der giver anledning til forskellige fænotyper. De fleste eukaryote organismer (såsom ærteplanterne, Mendel arbejdede på) har to alleler for hver egenskab, en arvet fra hver forælder.

Alleler på et sted kan være dominerende eller recessive ; dominerende alleler giver anledning til deres tilsvarende fænotyper, når de er parret med enhver anden allel for det samme træk, hvorimod recessive alleler kun giver anledning til deres tilsvarende fænotype, når de er parret med en anden kopi af den samme allel. Hvis du kender organismernes genotyper, kan du bestemme, hvilke alleler der er dominerende, og hvilke der er recessive. For eksempel, hvis allelen, der angiver høje stængler i ærteplanter, er dominerende over de allel, der specificerer korte stilke, vil ærteplanter, der arver en høj allel fra den ene forælder og en kort allel fra den anden forælder, også have høje stængler. Mendels arbejde viste, at alleler sorterer uafhængigt i produktionen af kønsceller eller kønsceller , hvilket sikrer variation i den næste generation. Selvom mendelsk arv fortsat er en god model for mange træk bestemt af enkelte gener (herunder en række velkendte genetiske lidelser ), omfatter den ikke de fysiske processer ved DNA-replikation og celledeling.

DNA -replikation og celledeling

Vækst, udvikling og reproduktion af organismer er afhængig af celledeling ; den proces, hvorved en enkelt celle deler sig i to sædvanligvis identiske datterceller . Dette kræver først at du laver en kopi af hvert gen i genomet i en proces kaldet DNA -replikation . Kopierne laves af specialiserede enzymer kendt som DNA-polymeraser , som "læser" en streng af det dobbeltspiral-DNA, kendt som templatestrengen, og syntetiserer en ny komplementær streng. Fordi DNA -dobbeltspiralen holdes sammen ved baseparring , specificerer sekvensen af ​​en streng fuldstændigt sekvensen af ​​dens komplement; derfor behøver kun en streng at blive læst af enzymet for at producere en tro kopi. Processen med DNA -replikation er semikonservativ ; det vil sige, at kopien af ​​genomet, der arves af hver dattercelle, indeholder en original og en nysyntetiseret DNA -streng.

Hastigheden af ​​DNA-replikation i levende celler blev først målt som hastigheden af ​​fag-T4-DNA-forlængelse i fag-inficerede E. coli og viste sig at være imponerende hurtig. I perioden med eksponentiel DNA -stigning ved 37 ° C var forlængelseshastigheden 749 nukleotider pr. Sekund.

Efter DNA-replikation er fuldført, skal cellen fysisk adskille de to kopier af genomet og dele sig i to adskilte membranbundne celler. I prokaryoter  ( bakterier og archaea ) sker dette normalt via en relativt enkel proces kaldet binær fission , hvor hvert cirkulært genom fastgøres til cellemembranen og adskilles i dattercellerne, når membranen invaginerer for at opdele cytoplasmaet i to membranbundne dele . Binær fission er ekstremt hurtig sammenlignet med frekvenserne for celledeling i eukaryoter . Eukaryot celledeling er en mere kompleks proces kendt som cellecyklussen ; DNA -replikation sker i en fase af denne cyklus kendt som S -fase , hvorimod processen med at adskille kromosomer og opdele cytoplasmaet sker under M -fasen .

Molekylær arv

Kopiering og transmission af genetisk materiale fra den ene generation af celler til den næste er grundlaget for molekylær arv og koblingen mellem de klassiske og molekylære billeder af gener. Organismer arver deres forældres egenskaber, fordi afkomets celler indeholder kopier af generne i deres forældres celler. I aseksuelt reproducerende organismer vil afkommet være en genetisk kopi eller klon af forældreorganismen. I seksuelt reproducerende organismer producerer en specialiseret form for celledeling kaldet meiose celler kaldet gameter eller kønsceller, der er haploide eller kun indeholder en kopi af hvert gen. De kønsceller, der produceres af hunner, kaldes æg eller æg, og dem, der produceres af mænd, kaldes sædceller . To kønsceller smelter sammen for at danne et diploid befrugtet æg , en enkelt celle, der har to sæt gener, med en kopi af hvert gen fra moderen og en fra faderen.

Under processen med meiotisk celledeling kan der undertiden forekomme en hændelse kaldet genetisk rekombination eller cross-over , hvor en længde af DNA på et kromatid byttes med en længde af DNA på det tilsvarende homologe ikke-søsterkromatid. Dette kan resultere i en assortiment af ellers forbundne alleler. Det mendelske princip om uafhængigt sortiment hævder, at hver af en forælders to gener for hver egenskab vil sortere uafhængigt i kønsceller; hvilken allel en organisme arver for et træk er ikke relateret til hvilken allel den arver for et andet træk. Dette er faktisk kun sandt for gener, der ikke findes på det samme kromosom eller er placeret meget langt fra hinanden på det samme kromosom. Jo tættere to gener ligger på det samme kromosom, jo ​​tættere vil de blive associeret i kønsceller, og jo oftere vil de forekomme sammen (kendt som genetisk kobling ). Gener, der er meget tætte, er i det væsentlige aldrig adskilt, fordi det er ekstremt usandsynligt, at der vil forekomme et krydsningspunkt mellem dem.

Molekylær udvikling

Mutation

DNA -replikation er for det meste ekstremt nøjagtig, men fejl ( mutationer ) forekommer. Fejlfrekvensen i eukaryote celler kan være så lav som 10-8 pr. Nukleotid pr. Replikation, hvorimod den for nogle RNA -vira kan være så høj som 10 -3 . Det betyder, at hver generation, hvert menneskeligt genom akkumulerer 1-2 nye mutationer. Små mutationer kan være forårsaget af DNA -replikation og kølvandet på DNA -skade og omfatte punktmutationer , hvor en enkelt base ændres, og frameshift -mutationer , hvor en enkelt base indsættes eller slettes. Hver af disse mutationer kan ændre genet ved missense (ændre et kodon for at kode for en anden aminosyre) eller nonsens (et for tidligt stopkodon ). Større mutationer kan skyldes fejl i rekombination til at forårsage kromosomale abnormiteter, herunder duplikering , sletning, omlægning eller inversion af store dele af et kromosom. Derudover kan DNA -reparationsmekanismer indføre mutationsfejl ved reparation af fysisk skade på molekylet. Reparationen, selv med mutation, er vigtigere for overlevelse end at gendanne en nøjagtig kopi, for eksempel ved reparation af dobbeltstrengede pauser .

Når flere forskellige alleler for et gen er til stede i en arts befolkning, kaldes det polymorf . De fleste forskellige alleler er funktionelt ækvivalente, men nogle alleler kan give anledning til forskellige fænotypiske træk . Et gens mest almindelige allel kaldes vildtypen , og sjældne alleler kaldes mutanter . Den genetiske variation i relative frekvenser af forskellige alleler i en population skyldes både naturlig selektion og genetisk drift . Vildtypealelen er ikke nødvendigvis forfader til mindre almindelige alleler, og den er heller ikke nødvendigvis montør .

De fleste mutationer inden for gener er neutrale og har ingen effekt på organismens fænotype ( tavse mutationer ). Nogle mutationer ændrer ikke aminosyresekvensen, fordi flere kodoner koder for den samme aminosyre ( synonyme mutationer ). Andre mutationer kan være neutrale, hvis de fører til ændringer i aminosyresekvensen, men proteinet fungerer stadig på samme måde som den nye aminosyre (f.eks. Konservative mutationer ). Mange mutationer er imidlertid skadelige eller endda dødelige og fjernes fra populationer ved naturlig selektion. Genetiske lidelser er et resultat af skadelige mutationer og kan skyldes spontan mutation hos det berørte individ eller kan arves. Endelig er en lille brøkdel af mutationer gavnlige , hvilket forbedrer organismens kondition og er ekstremt vigtigt for evolution, da deres retningsvalg fører til adaptiv udvikling .

Sekvenshomologi

En sekvensalignment, produceret af ClustalO , af pattedyr histon -proteiner

Gener med en seneste fælles forfader og dermed en fælles evolutionær herkomst er kendt som homologer . Disse gener opstår enten ved gentubbling i en organismes genom, hvor de er kendt som paralogiske gener, eller er et resultat af divergens mellem generne efter en speciationshændelse , hvor de er kendt som ortologe gener, og ofte udfører de samme eller lignende funktioner i beslægtede organismer. Det antages ofte, at funktionerne af ortologe gener ligner mere end paralogiske gener, selvom forskellen er minimal.

Forholdet mellem gener kan måles ved at sammenligne sekvensjusteringen af deres DNA. Graden af ​​sekvenslighed mellem homologe gener kaldes konserveret sekvens . De fleste ændringer i et gens sekvens påvirker ikke dets funktion, og derfor akkumulerer gener mutationer over tid ved neutral molekylær udvikling . Desuden vil enhver markering på et gen få dens sekvens til at afvige med en anden hastighed. Gener under stabiliserende selektion er begrænsede og ændrer sig derfor langsommere, mens gener under retningsbestemt selektion ændrer sekvens hurtigere. Sekvensforskellene mellem gener kan bruges til fylogenetiske analyser til at studere, hvordan disse gener har udviklet sig, og hvordan de organismer, de kommer fra, er relateret.

Oprindelsen af ​​nye gener

Evolutionær skæbne for dublerede gener.

Den mest almindelige kilde til nye gener i eukaryote slægter er genduplikering , hvilket skaber kopi -nummervariation af et eksisterende gen i genomet. De resulterende gener (paraloger) kan derefter afvige i rækkefølge og i funktion. Sæt af gener dannet på denne måde sammensætter en genfamilie . Gentagelser og tab inden for en familie er almindelige og repræsenterer en vigtig kilde til evolutionær biodiversitet . Nogle gange kan gentubbling resultere i en ikke -funktionel kopi af et gen, eller en funktionel kopi kan være genstand for mutationer, der resulterer i tab af funktion; sådanne ikke -funktionelle gener kaldes pseudogener .

"Forældreløse" gener , hvis sekvens ikke ligner eksisterende gener, er mindre almindelige end genduplikater. Det menneskelige genom indeholder et estimat på 18 til 60 gener uden identificerbare homologer uden for mennesker. Forældreløse gener stammer primært fra enten de novo- fremkomst fra tidligere ikke-kodende sekvens eller genduplikation efterfulgt af så hurtig sekvensændring, at det oprindelige forhold bliver uopdageligt. De novo -gener er typisk kortere og enklere i struktur end de fleste eukaryote gener, med få om nogen introner. Over lange evolutionære tidsperioder kan de novo -genfødsel være ansvarlig for en betydelig brøkdel af taksonomisk begrænsede genfamilier.

Horisontal genoverførsel refererer til overførsel af genetisk materiale gennem en anden mekanisme end reproduktion . Denne mekanisme er en almindelig kilde til nye gener i prokaryoter , der undertiden menes at bidrage mere til genetisk variation end genduplikation. Det er et almindeligt middel til at sprede antibiotikaresistens , virulens og adaptive metaboliske funktioner. Selvom vandret genoverførsel er sjælden i eukaryoter, er sandsynlige eksempler blevet identificeret på protist- og algengener, der indeholder gener af bakteriel oprindelse.

Genom

Den genomet er den samlede genetiske materiale i en organisme og indbefatter både generne og ikke-kodende sekvenser . Eukaryote gener kan kommenteres ved hjælp af FINDER.

Antal gener

Beskrivelse af antallet af gener for repræsentative planter (grøn), hvirveldyr (blå), hvirvelløse dyr (orange), svampe (gul), bakterier (lilla) og vira (grå). En indsats til højre viser de mindre genomer udvidet 100 gange arealmæssigt.

Den genomstørrelse , og antallet af gener det koder varierer meget mellem organismer. De mindste genomer forekommer i vira og viroider (som fungerer som et enkelt ikke-kodende RNA-gen). Omvendt kan planter have ekstremt store genomer, hvor ris indeholder> 46.000 proteinkodende gener. Det samlede antal proteinkodende gener (Jordens proteom ) anslås at være 5 millioner sekvenser.

Selvom antallet af basepar af DNA i det menneskelige genom har været kendt siden 1960'erne, har det estimerede antal gener ændret sig over tid som definitioner på gener, og metoder til påvisning af dem er blevet forfinet. Indledende teoretiske forudsigelser af antallet af menneskelige gener var så høje som 2.000.000. Tidlige eksperimentelle foranstaltninger viste, at der var 50.000-100.000 transkriberede gener ( udtrykte sekvensmærker ). Efterfølgende indikerede sekventeringen i Human Genome Project , at mange af disse transskriptioner var alternative varianter af de samme gener, og det samlede antal proteinkodende gener blev revideret ned til ~ 20.000 med 13 gener kodet på mitokondriegenomet . Med GENCODE -annotationsprojektet er dette estimat fortsat faldet til 19.000. Af det menneskelige genom består kun 1-2% af proteinkodende sekvenser, hvor resten er 'ikke-kodende' DNA, såsom introner , retrotransposoner og ikke-kodende RNA'er . Hver flercellet organisme har alle sine gener i hver celle i kroppen, men ikke alle gen fungerer i hver celle.

Væsentlige gener

Gen fungerer i det minimale genom for den syntetiske organisme , Syn 3 .

Essentielle gener er de gener, der menes at være kritiske for en organismes overlevelse. Denne definition forudsætter rigelig tilgængelighed af alle relevante næringsstoffer og fravær af miljøbelastning. Kun en lille del af en organismes gener er afgørende. Hos bakterier er anslået 250–400 gener afgørende for Escherichia coli og Bacillus subtilis , hvilket er mindre end 10% af deres gener. Halvdelen af ​​disse gener er ortologer i begge organismer og er stort set involveret i proteinsyntese . I den spirende gær Saccharomyces cerevisiae er antallet af essentielle gener lidt højere ved 1000 gener (~ 20% af deres gener). Selvom antallet er vanskeligere at måle i højere eukaryoter, anslås mus og mennesker at have omkring 2000 essentielle gener (~ 10% af deres gener). Den syntetiske organisme, Syn 3 , har et minimalt genom på 473 essentielle gener og kvasi-essentielle gener (nødvendigt for hurtig vækst), selvom 149 har ukendt funktion.

Væsentlige gener inkluderer husholdningsgener (kritiske for grundlæggende cellefunktioner) samt gener, der udtrykkes på forskellige tidspunkter i organismernes udvikling eller livscyklus . Husholdningsgener bruges som eksperimentelle kontroller ved analyse af genekspression , da de konstitutivt udtrykkes på et relativt konstant niveau.

Genetisk og genomisk nomenklatur

Gennomenklatur er blevet oprettet ved HUGO Gene Nomenclature Committee (HGNC), et udvalg af Human Genome Organization , for hver kendt humant gen i form af en godkendt gen navn og symbol (kort form forkortelse ), som kan tilgås via en database vedligeholdt af HGNC. Symboler vælges til at være unikke, og hvert gen har kun et symbol (selvom godkendte symboler undertiden ændres). Symboler holdes fortrinsvis i overensstemmelse med andre medlemmer af en genfamilie og med homologer i andre arter, især musen på grund af dens rolle som en fælles modelorganisme .

Genteknologi

Sammenligning af konventionel planteavl med transgen og cisgen genetisk modifikation.

Genteknik er modifikationen af ​​en organismes genom gennem bioteknologi . Siden 1970'erne er der blevet udviklet en række forskellige teknikker til specifikt at tilføje, fjerne og redigere gener i en organisme. For nylig udviklede genommanipulation teknikker anvender manipuleret nuklease enzymer til at skabe målrettet DNA-reparation i et kromosom til enten afbryde eller redigere et gen, når pausen er repareret. Det beslægtede udtryk syntetisk biologi bruges undertiden til at henvise til omfattende genteknik af en organisme.

Genteknik er nu et rutinemæssigt forskningsværktøj med modelorganismer . For eksempel tilføjes gener let til bakterier, og slægter af knockout -mus med et specifikt gens funktion forstyrret bruges til at undersøge genets funktion. Mange organismer er blevet genetisk modificeret til anvendelser inden for landbrug , industriel bioteknologi og medicin .

For flercellede organismer konstrueres embryoet typisk, som vokser ind i den voksne genetisk modificerede organisme . Imidlertid kan genomerne af celler i en voksen organisme redigeres ved hjælp af genterapiteknikker til behandling af genetiske sygdomme.

Se også

Referencer

Citater

Kilder

Hovedlærebog

Yderligere læsning

eksterne links