Egenskabeligt forstyrrede proteiner - Intrinsically disordered proteins

Konformationsfleksibilitet i SUMO-1- protein (PDB: 1a5r ). Den centrale del viser en forholdsvis ordnet struktur. Omvendt viser de N- og C-terminale regioner (henholdsvis venstre og højre) 'iboende lidelse', selvom en kort spiralformet region vedvarer i den N-terminale hale. Ti alternative NMR -modeller blev omdannet. Sekundære strukturelementer: α-spiraler (røde), β-tråde (blå pile).

Et iboende forstyrret protein ( IDP ) er et protein, der mangler en fast eller ordnet tredimensionel struktur , typisk i fravær af dets makromolekylære interaktionspartnere, såsom andre proteiner eller RNA. IDP'er spænder fra fuldt ustrukturerede til delvist strukturerede og inkluderer tilfældig spole , smeltede kuglelignende aggregater eller fleksible linkere i store multi -domæne proteiner. De betragtes undertiden som en separat klasse af proteiner sammen med kugleformede , fibrøse og membranproteiner .

Opdagelsen af ​​internt fordrevne har modbevist ideen om, at tredimensionelle strukturer af proteiner skal fikseres for at udføre deres biologiske funktioner . Dogmet om den stive proteinstruktur er blevet opgivet på grund af det stigende bevis på, at dynamik er nødvendig for proteinmaskinerne. På trods af deres mangel på stabil struktur er internt fordrevne en meget stor og funktionelt vigtig klasse af proteiner. Mange internt fordrevne kan vedtage en fast tredimensionel struktur efter binding til andre makromolekyler. Samlet set adskiller IDP'er sig fra strukturerede proteiner på mange måder og har en tendens til at have karakteristisk funktion, struktur, sekvens, interaktioner, evolution og regulering.

Historie

Et ensemble af NMR -strukturer i Thylakoid -opløseligt phosphoprotein TSP9, som viser en stort set fleksibel proteinkæde.

I 1930'erne-1950'erne blev de første proteinstrukturer løst ved proteinkrystallografi . Disse tidlige strukturer antydede, at en fast tredimensionel struktur generelt kan være påkrævet for at formidle biologiske funktioner af proteiner. Disse publikationer størkede det centrale dogme i molekylærbiologien ved, at aminosyresekvensen for et protein bestemmer dets struktur, hvilket igen bestemmer dets funktion. I 1950 skrev Karush om 'Configurational Adaptability', der modsiger denne antagelse. Han var overbevist om, at proteiner har mere end én konfiguration på samme energiniveau og kan vælge en, når de bindes til andre substrater. I 1960'erne antydede Levinthals paradoks , at den systematiske konformationssøgning af et langt polypeptid usandsynligt vil give en enkelt foldet proteinstruktur på biologisk relevante tidsskalaer (dvs. mikrosekunder til minutter). Mærkeligt nok kan der for mange (små) proteiner eller proteindomæner observeres relativt hurtig og effektiv genfoldning in vitro. Som anført i Anfinsens Dogme fra 1973 er ​​disse proteiners faste 3D -struktur unikt kodet i dets primære struktur (aminosyresekvensen), er kinetisk tilgængelig og stabil under en række (nær) fysiologiske forhold og kan derfor betragtes som den oprindelige tilstand af sådanne "ordnede" proteiner.

I løbet af de efterfølgende årtier kunne mange store proteineregioner imidlertid ikke tildeles i røntgendatasæt, hvilket indikerer, at de indtager flere positioner, som gennemsnittes i elektrontæthedskort . Manglen på faste, unikke positioner i forhold til krystalgitteret antydede, at disse regioner var "uordnede". Kernemagnetisk resonansspektroskopi af proteiner demonstrerede også tilstedeværelsen af ​​store fleksible linkere og terminaler i mange løste strukturelle ensembler.

I 2001 stillede Dunker spørgsmålstegn ved, om de nyopdagede oplysninger blev ignoreret i 50 år med flere kvantitative analyser, der blev tilgængelige i 2000'erne. I 2010'erne blev det klart, at internt fordrevne er almindelige blandt sygdomsrelaterede proteiner, såsom alfa-synuclein og tau .

Overflod

Det er nu generelt accepteret, at proteiner eksisterer som et ensemble af lignende strukturer med nogle regioner mere begrænsede end andre. IDP'er indtager den ekstreme ende af dette spektrum af fleksibilitet og inkluderer proteiner med betydelig lokal strukturstendens eller fleksible multidomainsamlinger.

Bioinformatiske forudsigelser indikerede, at iboende lidelse er mere almindelig i genomer og proteomer end i kendte strukturer i proteindatabasen . Baseret på DISOPRED2 forudsigelse forekommer lange (> 30 rester) uordnede segmenter i 2,0% af arkeiske, 4,2% af eubakterielle og 33,0% af eukaryote proteiner, herunder visse sygdomsrelaterede proteiner.

Biologiske roller

Meget dynamiske uordnede proteineregioner er blevet knyttet til funktionelt vigtige fænomener, såsom allosterisk regulering og enzymkatalyse . Mange uordnede proteiner har bindingsaffinitet med deres receptorer reguleret ved posttranslationel modifikation , således er det blevet foreslået, at fleksibiliteten af ​​uordnede proteiner letter de forskellige konformationelle krav til binding af de modificerende enzymer såvel som deres receptorer. Iboende lidelse er især beriget med proteiner, der er involveret i cellesignalering, transkription og kromatin -ombygningsfunktioner. Gener, der for nylig er født de novo, har en tendens til at have en højere lidelse.

Fleksible linkere

Uordnede områder findes ofte som fleksible linkere eller sløjfer, der forbinder domæner. Linker -sekvenser varierer meget i længden, men er typisk rige på polære uladede aminosyrer . Fleksible linkere giver forbindelsesdomæner mulighed for frit at vride og rotere for at rekruttere deres bindingspartnere via proteindomæne dynamik . De tillader også deres bindingspartnere til at inducere større målestok konformationsændringer af langtrækkende allosteri .

Lineære motiver

Lineære motiver er korte uordnede segmenter af proteiner, der medierer funktionelle interaktioner med andre proteiner eller andre biomolekyler (RNA, DNA, sukker osv.). Mange roller af lineære motiver er forbundet med celleregulering, for eksempel i kontrol af celleform, subcellulær lokalisering af individuelle proteiner og reguleret proteinomsætning. Ofte justerer post-translationelle ændringer som fosforylering affiniteten (ikke sjældent af flere størrelsesordener) af individuelle lineære motiver til specifikke interaktioner. Relativt hurtig udvikling og et relativt lille antal strukturelle begrænsninger til etablering af nye grænseflader (lav affinitet) gør det særligt udfordrende at opdage lineære motiver, men deres udbredte biologiske roller og det faktum, at mange vira efterligner/kaprer lineære motiver for effektivt at omkode inficerede celler understreger rettidig hastende forskning om dette meget udfordrende og spændende emne. I modsætning til globulære proteiner har internt fordrevne ikke rumligt disponerede aktive lommer. Ikke desto mindre er der i 80% af internt fordrevne (~ 3 snesevis), der udsættes for detaljeret strukturel karakterisering ved NMR, lineære motiver kaldet PreSMos (præstrukturerede motiver), der er forbigående sekundære strukturelle elementer, der er primet til målgenkendelse. I flere tilfælde er det blevet påvist, at disse forbigående strukturer bliver fulde og stabile sekundære strukturer, f.eks. Spiraler, ved målbinding. Derfor er PreSMos de formodede aktive websteder i IDP'er.

Koblet foldning og binding

Mange ustrukturerede proteiner gennemgår overgange til mere ordnede tilstande ved binding til deres mål (f.eks. Molecular Recognition Features (MoRF'er) ). Den koblede foldning og binding kan være lokal og kun involvere nogle få interagerende rester, eller det kan involvere et helt proteindomæne. Det blev for nylig vist, at den koblede foldning og binding muliggør begravelse af et stort overfladeareal, der kun ville være muligt for fuldt strukturerede proteiner, hvis de var meget større. Desuden kan visse uordnede områder tjene som "molekylære switches" til regulering af visse biologiske funktioner ved at skifte til ordnet konformation ved molekylær genkendelse som små molekylbinding, DNA/RNA-binding, ioninteraktioner osv.

Uordnede proteiners evne til at binde og dermed udøve en funktion viser, at stabilitet ikke er en nødvendig betingelse. Mange korte funktionelle steder, for eksempel korte lineære motiver er overrepræsenteret i uordnede proteiner. Uordnede proteiner og korte lineære motiver er særlig rigelige i mange RNA-vira, såsom Hendra-virus , HCV , HIV-1 og humane papillomavirus . Dette gør det muligt for sådanne vira at overvinde deres informationsbegrænsede genomer ved at lette binding og manipulation af et stort antal værtscelleproteiner .

Lidelse i bunden tilstand (uklare komplekser)

Egenskabens uordnede proteiner kan bevare deres konformationsfrihed, selvom de specifikt binder til andre proteiner. Den strukturelle lidelse i bunden tilstand kan være statisk eller dynamisk. I uklare komplekser er strukturel mangfoldighed påkrævet for funktion, og manipulation af den bundne uordnede region ændrer aktivitet. Den konformationelle ensemble af komplekset moduleres via posttranslationelle modifikationer eller protein-interaktioner. Specificiteten af ​​DNA -bindende proteiner afhænger ofte af længden af ​​fuzzy regioner, som varieres ved alternativ splejsning. Nogle fuzzy -komplekser kan udvise høj bindingsaffinitet, selvom andre undersøgelser viste forskellige affinitetsværdier for det samme system i et andet koncentrationsregime.

Strukturelle aspekter

Egenskabens uordnede proteiner tilpasser mange forskellige strukturer in vivo efter cellens betingelser og skaber et strukturelt eller konformationelt ensemble.

Derfor er deres strukturer stærkt funktionsrelaterede. Imidlertid er det kun få proteiner, der er fuldstændig uordnede i deres oprindelige tilstand. Disorder findes for det meste i intrinsically disordered regions (IDR'er) inden for et ellers velstruktureret protein. Udtrykket intrinsically disordered protein (IDP) omfatter derfor proteiner, der indeholder IDR'er såvel som fuldstændigt uordnede proteiner.

Eksistensen og slags proteinforstyrrelse er kodet i dets aminosyresekvens. Generelt er IDP'er kendetegnet ved et lavt indhold af omfangsrige hydrofobe aminosyrer og en høj andel polære og ladede aminosyrer, der normalt omtales som lav hydrofobicitet. Denne ejendom fører til gode interaktioner med vand. Desuden fremmer høje nettoladninger uorden på grund af elektrostatisk frastødning, der skyldes ens ladede rester. Uordnede sekvenser kan således ikke begrave en hydrofob kerne tilstrækkeligt til at foldes til stabile kugleformede proteiner. I nogle tilfælde giver hydrofobe klynger i uordnede sekvenser spor til identifikation af de regioner, der gennemgår koblet foldning og binding (se biologiske roller ). Mange uordnede proteiner afslører regioner uden nogen regelmæssig sekundær struktur. Disse regioner kan betegnes som fleksible sammenlignet med strukturerede sløjfer. Selvom sidstnævnte er stive og kun indeholder et sæt Ramachandran -vinkler, involverer internt fordrevne flere sæt vinkler. Udtrykket fleksibilitet bruges også til velstrukturerede proteiner, men beskriver et andet fænomen i sammenhæng med uordnede proteiner. Fleksibilitet i strukturerede proteiner er bundet til en ligevægtstilstand, mens det ikke er tilfældet i internt fordrevne. Mange uordnede proteiner afslører også sekvenser med lav kompleksitet , dvs. sekvenser med overrepræsentation af få rester . Selvom lavkompleksitetssekvenser er en stærk indikation på lidelse, er det omvendte ikke nødvendigvis sandt, det vil sige, at ikke alle uordnede proteiner har sekvenser med lav kompleksitet. Uordnede proteiner har et lavt indhold af forudsagt sekundær struktur .

Eksperimentel validering

IDP'er kan valideres i flere sammenhænge. De fleste metoder til eksperimentel validering af internt fordrevne er begrænset til ekstraherede eller rensede proteiner, mens nogle nye eksperimentelle strategier har til formål at undersøge in vivo -konformationer og strukturelle variationer af internt fordrevne i intakte levende celler og systematiske sammenligninger mellem deres dynamik in vivo og in vitro .

In vivo nærmer sig

Det første direkte bevis for in vivo- persistens af iboende lidelse er blevet opnået ved NMR i celle ved elektroporering af et oprenset IDP og genopretning af celler til en intakt tilstand.

Større skala in vivo validering af IDR forudsigelser er nu mulig ved hjælp af biotin 'maleri'.

In vitro tilgange

Egentligt udfoldede proteiner, når de er renset, kan identificeres ved forskellige eksperimentelle metoder. Den primære metode til at opnå information om uordnede områder af et protein er NMR -spektroskopi . Manglen på elektrontæthed i krystallografiske røntgenundersøgelser kan også være et tegn på uorden.

Foldede proteiner har en høj densitet (delvis specifikt volumen på 0,72-0,74 ml/g) og tilsvarende lille gyrationsradius . Derfor kan udfoldede proteiner detekteres ved metoder, der er følsomme over for molekylær størrelse, densitet eller hydrodynamisk træk , såsom størrelsesekskluderingskromatografi , analytisk ultracentrifugering , røntgenstråling med lille vinkel (SAXS) og målinger af diffusionskonstanten . Udfoldede proteiner er også kendetegnet ved deres mangel på sekundær struktur , vurderet ved fjern-UV (170-250 nm) cirkulær dikroisme (især et udtalt minimum ved ~ 200 nm) eller infrarød spektroskopi. Ufoldede proteiner også har udsat backbone peptid gruppe, der løber opløsningsmiddel, således at de let spaltes af proteaser , undergå hurtig hydrogen-deuterium udveksling og udviser en lille dispersion (<1 ppm) i deres 1H amid kemiske skift som målt ved NMR . (Foldede proteiner viser typisk dispersioner så store som 5 ppm for amidprotonerne.) For nylig er der blevet introduceret nye metoder, herunder Fast parallel proteolyse (FASTpp) , som gør det muligt at bestemme fraktionen foldet/uorden uden behov for rensning. Selv subtile forskelle i stabiliteten af ​​missense-mutationer, proteinpartnerbinding og (selv) polymerisationsinduceret foldning af (f.eks. Spolede spoler) kan detekteres ved hjælp af FASTpp som for nylig demonstreret ved hjælp af tropomyosin-troponin-proteininteraktionen. Fuldt ustrukturerede proteinområder kan eksperimentelt valideres ved deres overfølsomhed over for proteolyse ved hjælp af korte fordøjelsestider og lave proteasekoncentrationer.

Bulkmetoder til undersøgelse af IDP-struktur og dynamik omfatter SAXS til information om ensembleform, NMR til atomistisk ensembleforfining, Fluorescens til visualisering af molekylære interaktioner og konformationelle overgange, røntgenkrystallografi for at fremhæve flere mobile regioner i ellers stive proteinkrystaller, kryo-EM for at afsløre mindre faste dele af proteiner, lysspredning til overvågning af størrelsesfordelinger af internt fordrevne eller deres aggregeringskinetik, kemisk forskydning af NMR og cirkulær dikroisme til overvågning af sekundære strukturer af internt fordrevne.

Enkeltmolekylære metoder til undersøgelse af internt fordrevne inkluderer spFRET til undersøgelse af konformationsfleksibilitet for internt fordrevne og kinetikken ved strukturelle overgange, optisk pincet til indsigt i høj opløsning i ensembler til internt fordrevne og deres oligomerer eller aggregater, nanoporer til afsløring af globale formfordelinger af internt fordrevne, magnetiske pincet for at studere strukturelle overgange i lange tider ved lave kræfter, højhastigheds- AFM for direkte at visualisere rumlig-tidsmæssig fleksibilitet af internt fordrevne.

Disorder -annotering

REMARK465 - manglende elektrontætheder i røntgenstruktur, der repræsenterer proteinforstyrrelse ( PDB : 1a22 , humant væksthormon bundet til receptor). Kompilering af skærmbilleder fra PDB -database og molekylrepræsentation via VMD . Blå og røde pile peger på manglende rester på henholdsvis receptor og væksthormon.

Iboende lidelse kan enten kommenteres fra eksperimentel information eller forudsiges med specialiseret software. Disorder-forudsigelsesalgoritmer kan forudsige tilbøjelighed til Intrinsic Disorder (ID) med høj nøjagtighed (nærmer sig omkring 80%) baseret på primær sekvenssammensætning, lighed med ikke-tildelte segmenter i proteinrøntgen-datasæt, fleksible regioner i NMR-undersøgelser og fysisk-kemiske egenskaber af aminosyrer .

Disorder databaser

Databaser er blevet etableret til at kommentere proteinsekvenser med information om iboende lidelse. Den DisProt database indeholder en samling af manuelt kurateret proteinsegmenter, som er blevet eksperimentelt konstateret, at de i uorden. MobiDB er en database, der kombinerer eksperimentelt kuraterede lidelsesannoteringer (f.eks. Fra DisProt) med data, der stammer fra manglende rester i røntgenkrystallografiske strukturer og fleksible regioner i NMR-strukturer.

Forudsiger IDP'er efter rækkefølge

Adskillelse af uorden fra ordnede proteiner er afgørende for forudsigelse af lidelser. Et af de første trin for at finde en faktor, der adskiller IDP'er fra ikke-IDP'er, er at specificere skævheder inden for aminosyresammensætningen. Følgende hydrofile, ladede aminosyrer A, R, G, Q, S, P, E og K er blevet karakteriseret som lidelsesfremmende aminosyrer, mens ordrefremmende aminosyrer W, C, F, I, Y, V, L og N er hydrofobe og uladede. De resterende aminosyrer H, M, T og D er tvetydige, findes i både ordnede og ustrukturerede regioner. En nyere analyse rangerede aminosyrer efter deres tilbøjelighed til at danne uordnede regioner som følger (rækkefølge, der fremmer uordenfremmende): W, F, Y, I, M, L, V, N, C, T, A, G, R, D, H, Q, K, S, E, P.

Disse oplysninger er grundlaget for de fleste sekvensbaserede forudsigere. Regioner med lidt eller ingen sekundær struktur, også kendt som NORS (NO Regular Secondary structure) regioner og regioner med lav kompleksitet kan let påvises. Imidlertid indeholder ikke alle uordnede proteiner sådanne sekvenser med lav kompleksitet.

Metoder til forudsigelse

Det er meget dyrt og tidskrævende at bestemme forstyrrede regioner ud fra biokemiske metoder. På grund af IDP'ernes variable karakter kan kun visse aspekter af deres struktur detekteres, så en fuld karakterisering kræver et stort antal forskellige metoder og eksperimenter. Dette øger udgifterne til IDP -bestemmelse yderligere. For at overvinde denne forhindring oprettes computerbaserede metoder til forudsigelse af proteinstruktur og funktion. Det er et af bioinformatikens hovedmål at udlede viden ved forudsigelse. Prediktorer til IDP -funktion udvikles også, men bruger hovedsageligt strukturel information såsom lineære motivsteder . Der er forskellige metoder til at forudsige IDP -struktur, såsom neurale netværk eller matrixberegninger, baseret på forskellige strukturelle og/eller biofysiske egenskaber.

Mange beregningsmetoder udnytter sekvensinformation til at forudsige, om et protein er uordentligt. Bemærkelsesværdige eksempler på sådan software inkluderer IUPRED og Disopred. Forskellige metoder kan bruge forskellige definitioner af uorden. Metaprediktorer viser et nyt koncept, der kombinerer forskellige primære forudsigere for at skabe en mere kompetent og præcis forudsigelse.

På grund af de forskellige tilgange til at forudsige uordenede proteiner er det ret vanskeligt at estimere deres relative nøjagtighed. For eksempel trænes neurale netværk ofte i forskellige datasæt. Disorder-forudsigelseskategorien er en del af det halvårlige CASP- eksperiment, der er designet til at teste metoder i overensstemmelse med nøjagtighed ved at finde regioner med manglende 3D-struktur (markeret i PDB-filer som REMARK465, manglende elektrontætheder i røntgenstrukturer).

Uorden og sygdom

Egens ustrukturerede proteiner har været impliceret i en række sygdomme. Aggregering af fejlfoldede proteiner er årsag til mange synukleinopatier og toksicitet, da disse proteiner begynder at binde tilfældigt til hinanden og kan føre til kræft eller hjerte -kar -sygdomme. Derved kan fejlfoldning ske spontant, fordi der laves millioner af kopier af proteiner i løbet af en organismes levetid. Aggregeringen af ​​det iboende ustrukturerede protein α-synuclein menes at være ansvarlig. Den strukturelle fleksibilitet af dette protein sammen med dets modtagelighed for modifikation i cellen fører til fejlfoldning og aggregering. Genetik, oxidativ og nitrativ stress samt mitokondrielt svækkelse påvirker den strukturelle fleksibilitet af det ustrukturerede α-synuclein-protein og tilhørende sygdomsmekanismer. Mange vigtige tumorsuppressorer har store iboende ustrukturerede områder, for eksempel p53 og BRCA1. Disse områder af proteinerne er ansvarlige for at formidle mange af deres interaktioner. At tage cellens oprindelige forsvarsmekanismer som en model af lægemidler kan udvikles og forsøge at blokere stedet for skadelige substrater og hæmme dem og dermed modvirke sygdommen.

Computersimuleringer

På grund af den høje strukturelle heterogenitet vil NMR/SAXS opnåede eksperimentelle parametre være et gennemsnit over et stort antal meget forskellige og uordnede tilstande (et ensemble af uordnede tilstande). For at forstå de strukturelle konsekvenser af disse eksperimentelle parametre er der derfor en nødvendighed for nøjagtig repræsentation af disse ensembler ved computersimuleringer. Alle atom molekylære dynamiske simuleringer kan bruges til dette formål, men deres anvendelse er begrænset af nøjagtigheden af ​​de nuværende kraftfelter i repræsentation af uordnede proteiner. Ikke desto mindre er nogle kraftfelter eksplicit udviklet til at studere uordnede proteiner ved at optimere kraftfeltparametre ved hjælp af tilgængelige NMR-data for uordnede proteiner. (eksemplerne er CHARMM 22*, CHARMM 32, Amber ff03* osv.)

MD-simuleringer begrænset af eksperimentelle parametre (fastholdt-MD) er også blevet brugt til at karakterisere uordnede proteiner. I princippet kan man prøve hele konformationsrummet, da en MD-simulering (med nøjagtigt kraftfelt) køres længe nok. På grund af meget høj strukturel heterogenitet er de tidsskalaer, der skal køres til dette formål, meget store og er begrænset af beregningskraft. Imidlertid er andre beregningsteknikker såsom accelereret-MD-simuleringer, replika-udvekslingssimuleringer , metadynamik , multikanoniske MD-simuleringer eller metoder, der anvender grovkornet repræsentation, blevet brugt til at prøve et bredere konformationsrum i mindre tidsskalaer.

Desuden er forskellige protokoller og metoder til analyse af IDP'er, såsom undersøgelser baseret på kvantitativ analyse af GC -indhold i gener og deres respektive kromosomale bånd, blevet brugt til at forstå funktionelle IDP -segmenter.

Se også

Referencer

eksterne links