Protein primær struktur - Protein primary structure

Protein primary structure Protein secondary structure Protein tertiary structure Protein quaternary structure
Billedet ovenfor indeholder klikbare links
Interaktivt diagram over proteinstruktur ved hjælp af PCNA som et eksempel. ( FBF : 1AXC )

Protein primær struktur er den lineære sekvens af aminosyrer i et peptid eller protein . Efter konvention rapporteres den primære struktur af et protein startende fra den amino- terminale (N) ende til den carboxyl- terminale (C) ende. Proteinbiosyntese udføres oftest af ribosomer i celler. Peptider kan også syntetiseres i laboratoriet. Protein primære strukturer kan direkte sekventeres eller udledes fra DNA-sekvenser .

Dannelse

Biologisk

Aminosyrer polymeriseres via peptidbindinger for at danne en lang rygrad , hvor de forskellige aminosyresidekæder stikker ud langs den. I biologiske systemer produceres proteiner under translation af en celles ribosomer . Nogle organismer kan også fremstille korte peptider ved ikke-ribosomal peptidsyntese , som ofte bruger andre aminosyrer end standard 20 og kan cykliseres, modificeres og tværbindes.

Kemisk

Peptider kan syntetiseres kemisk via en række laboratoriemetoder. Kemiske metoder syntetiserer typisk peptider i den modsatte rækkefølge (startende ved C-terminalen) til biologisk proteinsyntese (startende ved N-terminalen).

Notation

Proteinsekvens er typisk noteret som en række bogstaver, der viser aminosyrerne, der starter ved den amino- terminale ende til den carboxyl- terminale ende. Enten en kode med tre bogstaver eller en enkelt bogstav kan bruges til at repræsentere de 20 naturligt forekommende aminosyrer såvel som blandinger eller tvetydige aminosyrer (svarende til nukleinsyrenotation ).

Peptider kan direkte sekventeres eller udledes fra DNA-sekvenser . Der findes nu store sekvensdatabaser , der samler kendte proteinsekvenser.

20 naturlig aminosyrenotation
Aminosyre 3-bogstaver 1-bogstav
Alanine Ala EN
Arginin Arg R
Asparagine Asn N
Asparaginsyre Asp D
Cystein Cys C
Glutaminsyre Glu E
Glutamin Gln Q
Glycin Gly G
Histidin Hans H
Isoleucin Ile jeg
Leucin Leu L
Lysin Lys K
Methionin Mødte M
Phenylalanin Phe F
Proline Pro P
Serine Ser S
Threonine Thr T
Tryptofan Trp W
Tyrosin Tyr Y
Valine Val V
Tvetydig aminosyrenotation
Symbol Beskrivelse Restprodukter repræsenteret
x Enhver aminosyre eller ukendt Alle
B Aspartat eller asparagin D, N
Z Glutamat eller glutamin E, Q
J Leucin eller isoleucin Jeg, L.
Φ Hydrofob V, I, L, F, W, M
Ω Aromatisk F, W, Y, H
Ψ Alifatisk V, I, L, M
π Lille P, G, A, S
ζ Hydrofil S, T, H, N, Q, E, D, K, R, Y
+ Positivt ladet K, R, H
- Negativt opladet D, E

Modifikation

Generelt er polypeptider uforgrenede polymerer, så deres primære struktur kan ofte specificeres ved sekvensen af aminosyrer langs deres rygrad. Imidlertid kan proteiner blive tværbundet, mest almindeligt ved disulfidbindinger , og den primære struktur kræver også specificering af tværbindingsatomer, f.eks. Specificering af cysteiner involveret i proteinets disulfidbindinger. Andre tværbindinger inkluderer desmosin .

Isomerisering

De chirale centre i en polypeptidkæde kan gennemgå racemisering . Selvom det ikke ændrer sekvensen, påvirker det sekvensens kemiske egenskaber. Især kan L- aminosyrerne, der normalt findes i proteiner, spontant isomerisere ved atomet til dannelse af D- aminosyrer, som ikke kan spaltes af de fleste proteaser . Derudover kan prolin danne stabile trans-isomerer ved peptidbindingen.

Posttranslational ændring

Endelig kan proteinet gennemgå en række posttranslational ændringer , som kort er opsummeret her.

Den N-terminale aminogruppe i et polypeptid kan modificeres kovalent, f.eks.

Fig. 1 N-terminal acetylering
  • acetylering
Den positive ladning på den N-terminale aminogruppe kan elimineres ved at ændre den til en acetylgruppe (N-terminal blokering).
  • formylering
Den N-terminale methionin, der normalt findes efter translation, har en N-terminal blokeret med en formylgruppe. Denne formylgruppe (og undertiden selve methioninresten, hvis den efterfølges af Gly eller Ser), fjernes af enzymet deformylase .
  • pyroglutamat
Fig. 2 Dannelse af pyroglutamat fra en N-terminal glutamin
En N-terminal glutamin kan angribe sig selv og danne en cyklisk pyroglutamatgruppe.
  • myristoylation
Svarende til acetylering. I stedet for en simpel methylgruppe har myristoylgruppen en hale på 14 hydrofobe carbonatomer, hvilket gør den ideel til forankring af proteiner til cellulære membraner .

Den C-terminale carboxylatgruppe i et polypeptid kan også modificeres, f.eks.

Fig. 3 C-terminal amidering
  • amination (se figur)
C-terminalen kan også blokeres (således neutralisere dens negative ladning) ved aminering.
  • glycosylphosphatidylinositol (GPI) vedhæftning
Glycosylphosphatidylinositol (GPI) er en stor, hydrofob phospholipid protesegruppe, der forankrer proteiner til cellulære membraner . Det er bundet til polypeptid C-terminalen gennem en amidbinding, der derefter forbinder med ethanolamin, derfra til diverse sukkerarter og til sidst til phosphatidylinositol-lipiddelen.

Endelig peptid sidekæder kan også modificeres covalent, fx

  • fosforylering
Bortset fra spaltning er phosphorylering måske den vigtigste kemiske modifikation af proteiner. En phosphatgruppe kan være bundet til sidekædehydroxylgruppen af ​​serin-, threonin- og tyrosinrester, idet der tilsættes en negativ ladning på dette sted og producerer en unaturlig aminosyre. Sådanne reaktioner katalyseres af kinaser, og den omvendte reaktion katalyseres af phosphataser. De phosphorylerede tyrosiner anvendes ofte som "håndtag", hvormed proteiner kan binde til hinanden, hvorimod phosphorylering af Ser / Thr ofte inducerer konformationsændringer, formodentlig på grund af den indførte negative ladning. Virkningerne af phosphorylering af Ser / Thr kan undertiden simuleres ved at mutere Ser / Thr-resten til glutamat.
Et samlet navn for et sæt meget almindelige og meget heterogene kemiske ændringer. Sukkerdele kan være bundet til sidekædehydroxylgrupperne af Ser / Thr eller til sidekædeamidgrupperne i Asn. Sådanne vedhæftede filer kan tjene mange funktioner lige fra øget opløselighed til kompleks genkendelse. Al glykosylering kan blokeres med visse hæmmere, såsom tunicamycin .
I denne modifikation angriber en asparagin- eller aspartatsidekæde den følgende peptidbinding og danner et symmetrisk succinimid-mellemprodukt. Hydrolyse af mellemproduktet producerer enten aspartat eller β-aminosyren, iso (Asp). For asparagin resulterer begge produkter i tab af amidgruppen, deraf "deamidering".
Prolinrester kan være hydroxylater ved et af de to atomer, ligesom lysin (ved et atom). Hydroxyprolin er en kritisk komponent i kollagen , som bliver ustabil ved dets tab. Hydroxyleringsreaktionen katalyseres af et enzym, der kræver ascorbinsyre (vitamin C), med mangler, som fører til mange bindevævssygdomme såsom skørbug .
Flere proteinrester kan methyleres, især de positive grupper af lysin og arginin . Argininrester interagerer med nukleinsyrephosphatrygraden og danner almindeligvis hydrogenbindinger med baseresterne, især guanin , i protein-DNA-komplekser. Lysinrester kan være enkelt, dobbelt og endda tredobbelt methyleret. Methylering ændrer dog ikke den positive ladning på sidekæden.
Acetylering af lysinaminogrupperne er kemisk analog med acetyleringen af ​​N-terminalen. Funktionelt anvendes imidlertid acetylering af lysinrester til at regulere proteins binding til nukleinsyrer. Annulleringen af ​​den positive ladning på lysinet svækker den elektrostatiske tiltrækning for de (negativt ladede) nukleinsyrer.
  • sulfatering
Tyrosiner kan sulfateres på deres atom. Noget usædvanligt forekommer denne modifikation i Golgi-apparatet , ikke i det endoplasmatiske retikulum . Svarende til phosphorylerede tyrosiner anvendes sulfaterede tyrosiner til specifik genkendelse, fx i kemokinreceptorer på celleoverfladen. Som med phosphorylering tilføjer sulfation en negativ ladning til et tidligere neutralt sted.
  • prenylering og palmitoylering
Den hydrofobe isopren (fx farnesyl-, geranyl- og geranylgeranylgrupper) og palmitoylgrupper kan tilsættes til atomet af cysteinrester for at forankre proteiner til cellulære membraner . I modsætning til den GPI og myritoyl ankre, er disse grupper ikke nødvendigvis tilsættes ved terminalerne.
  • carboxylering
En relativt sjælden modifikation, der tilføjer en ekstra carboxylatgruppe (og dermed en dobbelt negativ ladning) til en glutamatsidekæde, der producerer en Gla-rest. Dette bruges til at styrke bindingen til "hårde" metalioner, såsom calcium .
  • ADP-ribosylering
Den store ADP-ribosylgruppe kan overføres til flere typer sidekæder inden for proteiner med heterogene effekter. Denne modifikation er et mål for de stærke toksiner fra forskellige bakterier, f.eks. Vibrio cholerae , Corynebacterium diphtheriae og Bordetella pertussis .
Forskellige foldede proteiner i fuld længde kan ved deres C-terminaler fæstnes til sidekæde-ammoniumgrupperne af lysiner fra andre proteiner. Ubiquitin er den mest almindelige af disse og signalerer normalt, at det ubiquitin-mærkede protein skal nedbrydes.

De fleste af de ovenfor anførte polypeptidmodifikationer forekommer post-translationelt , dvs. efter at proteinet er blevet syntetiseret på ribosomet , typisk forekommende i det endoplasmatiske retikulum , en subcellulær organel i den eukaryote celle.

Mange andre kemiske reaktioner (f.eks. Cyanylering) er blevet anvendt på proteiner af kemikere, selvom de ikke findes i biologiske systemer.

Spaltning og ligering

Ud over dem, der er anført ovenfor, er den vigtigste ændring af den primære struktur peptidspaltning (ved kemisk hydrolyse eller ved proteaser ). Proteiner syntetiseres ofte i en inaktiv forløberform; typisk blokerer et N-terminal eller C-terminalt segment det aktive sted i proteinet og inhiberer dets funktion. Proteinet aktiveres ved spaltning af det inhiberende peptid.

Nogle proteiner har endda styrken til at spalte sig selv. Typisk vil hydroxylgruppen i en serin (sjældent threonin) eller thiolgruppen i en cysteinrest angribe carbonylcarbonet i den foregående peptidbinding og danne et tetrahedralt bundet mellemprodukt [klassificeret som hydroxyoxazolidin (Ser / Thr) eller hydroxythiazolidin ( Cys) mellemliggende]. Dette mellemprodukt har tendens til at vende tilbage til amidformen og udvise den angribende gruppe, da amidformen sædvanligvis foretrækkes af fri energi (sandsynligvis på grund af den stærke resonansstabilisering af peptidgruppen). Imidlertid kan yderligere molekylære interaktioner gøre amidformen mindre stabil; aminogruppen udvises i stedet, hvilket resulterer i en ester (Ser / Thr) eller thioester (Cys) binding i stedet for peptidbindingen. Denne kemiske reaktion kaldes NO acyl shift .

Esteren / thioesterbindingen kan løses på flere måder:

  • Enkel hydrolyse vil splitte polypeptidkæden, hvor den fortrængte aminogruppe bliver den nye N-terminal. Dette ses i modningen af ​​glycosylasparaginase.
  • En β-eliminationsreaktion deler også kæden, men resulterer i en pyruvoylgruppe ved den nye N-terminal. Denne pyruvoylgruppe kan anvendes som en kovalent bundet katalytisk cofaktor i nogle enzymer, især decarboxylaser, såsom S-adenosylmethionindecarboxylase (SAMDC), der udnytter pyruvoylgruppens elektronudtagende effekt.
  • Intramolekylær transesterificering, hvilket resulterer i et forgrenet polypeptid. I inteiner brydes den nye esterbinding ved et intramolekylært angreb af den snart kommende C-terminale asparagin.
  • Intermolekylær transesterificering kan overføre et helt segment fra et polypeptid til et andet, som det ses i autoprocessering af Hedgehog-proteinet.

Sekvenskompression

Komprimering af aminosyresekvenser er en forholdsvis udfordrende opgave. De eksisterende specialiserede aminosyresekvenskompressorer er lave sammenlignet med DNA-sekvenskompressorer, hovedsageligt på grund af dataens egenskaber. For eksempel er modellering af inversioner sværere på grund af det omvendte informationstab (fra aminosyrer til DNA-sekvens). Den nuværende tabsfri datakompressor, der giver højere kompression, er AC2. AC2 blander forskellige kontekstmodeller ved hjælp af neurale netværk og koder dataene ved hjælp af aritmetisk kodning.

Historie

Forslaget om, at proteiner var lineære kæder af a-aminosyrer, blev fremsat næsten samtidigt af to forskere på den samme konference i 1902, det 74. møde i Society of German Scientists and Physicians, der blev afholdt i Karlsbad. Franz Hofmeister fremsatte forslaget om morgenen baseret på hans observationer af biuretreaktionen i proteiner. Hofmeister blev efterfulgt et par timer senere af Emil Fischer , der havde samlet et væld af kemiske detaljer, der understøtter peptidbindingsmodellen. For fuldstændighedens skyld blev forslaget om, at proteiner indeholdt amidbindinger, fremsat så tidligt som i 1882 af den franske kemiker E. Grimaux.

På trods af disse data og senere beviser for, at proteolytisk fordøjede proteiner kun gav oligopeptider, blev ideen om, at proteiner var lineære, uforgrenede aminosyrer, accepteret ikke med det samme. Nogle vel respekterede forskere som William Astbury tvivlede på, at kovalente bindinger var stærke nok til at holde så lange molekyler sammen; de frygtede, at termiske agitationer ville ryste sådanne lange molekyler. Hermann Staudinger stod over for lignende fordomme i 1920'erne, da han argumenterede for, at gummi var sammensat af makromolekyler .

Således opstod der flere alternative hypoteser. Den kolloide proteinhypotese sagde, at proteiner var kolloide samlinger af mindre molekyler. Denne hypotese blev modbevist i 1920'erne ved ultracentrifugeringsmålinger af Theodor Svedberg, der viste, at proteiner havde en veldefineret, reproducerbar molekylvægt og ved elektroforetiske målinger af Arne Tiselius, der viste, at proteiner var enkeltmolekyler. En anden hypotese, cyclolhypotesen , der blev fremført af Dorothy Wrinch , foreslog, at det lineære polypeptid gennemgik en kemisk cyclol-omlejring C = O + HN C (OH) -N, der tværbinder dets rygradsamidgrupper og danner et todimensionelt stof . Andre primære strukturer af proteiner blev foreslået af forskellige forskere, såsom diketopiperazin-modellen fra Emil Abderhalden og pyrrol / piperidin-modellen fra Troensegaard i 1942. Selvom de aldrig blev givet meget tillid, blev disse alternative modeller endelig modbevist, da Frederick Sanger med succes sekvenserede insulin og ved den krystallografiske bestemmelse af myoglobin og hæmoglobin af Max Perutz og John Kendrew .

Primær struktur i andre molekyler

Enhver heteropolymer med lineær kæde kan siges at have en "primær struktur" i analogi med anvendelsen af ​​udtrykket for proteiner, men denne anvendelse er sjælden sammenlignet med den ekstremt almindelige anvendelse i forhold til proteiner. I RNA , som også har omfattende sekundær struktur , betegnes den lineære basekæde generelt bare som "sekvensen", som den er i DNA (som normalt danner en lineær dobbelt helix med ringe sekundær struktur). Andre biologiske polymerer, såsom polysaccharider, kan også anses for at have en primær struktur, skønt anvendelsen ikke er standard.

Forhold til sekundær og tertiær struktur

Den primære struktur af en biologisk polymer bestemmer i høj grad den tredimensionelle form ( tertiær struktur ). Proteinsekvens kan bruges til at forudsige lokale træk , såsom segmenter af sekundær struktur eller trans-membranregioner. Imidlertid forbyder kompleksiteten af proteinfoldning i øjeblikket at forudsige den tertiære struktur af et protein fra dets sekvens alene. At kende strukturen af ​​en lignende homolog sekvens (for eksempel et medlem af den samme proteinfamilie ) tillader meget nøjagtig forudsigelse af den tertiære struktur ved homologimodellering . Hvis proteinsekvensen i fuld længde er tilgængelig, er det muligt at estimere dens generelle biofysiske egenskaber , såsom dens isoelektriske punkt .

Sekvensfamilier bestemmes ofte af sekvensgruppering , og strukturelle genomforskningsprojekter har til formål at producere et sæt repræsentative strukturer til at dække sekvensområdet for mulige ikke-redundante sekvenser.

Se også

Noter og referencer