Generisk modelorganismedatabase - Generic Model Organism Database

Generisk Model Organism Database projektlogo

Den generiske model organisme Database ( GMOD ) Projektet giver biologiske forskningsmiljøer med en værktøjskasse af open source-software -komponenter til visualisering, kommentering, styring og lagring af biologiske data. GMOD-projektet er finansieret af United States National Institutes of Health , National Science Foundation og USDA Agricultural Research Service .

Historie

GMOD-projektet blev startet i begyndelsen af ​​2000'erne som et samarbejde mellem flere modelorganismedatabaser (MOD'er), der delte et behov for at oprette lignende softwareværktøjer til behandling af data fra sekventeringsprojekter. MOD'er eller organisme-specifikke databaser beskriver genom og anden information om vigtige eksperimentelle organismer inden for biovidenskab og fanger de store mængder data og information, der genereres af moderne biologi . Snarere end hver gruppe designe deres egen software, fire store MODs-- FlyBase , Saccharomyces Genome Database , Mouse Genome Database , og WormBase -worked sammen om at skabe applikationer, der giver funktionalitet kræves af alle mods, såsom software til at hjælpe styre data i MOD og for at hjælpe brugerne med at få adgang til og forespørgsel på dataene.

GMOD-projektet arbejder på at holde softwarekomponenter interoperable. Til dette formål bruger mange af værktøjerne et fælles input / output-filformat eller kører en Chado-skema-database.

Chado-databaseskema

Chado-skemaet sigter mod at dække mange af de klasser af data, der ofte bruges af moderne biologer, fra genetiske data til fylogenetiske træer til publikationer til organismer til mikroarraydata til ID'er til RNA / proteinekspression. Chado bruger omfattende kontrollerede ordforråd til at skrive alle enheder i databasen; for eksempel: gener, transkripter, exoner, transponerbare elementer osv., opbevares i en funktionstabel med typen leveret af Sequence Ontology . Når en ny type føjes til sekvensontologien, kræver funktionstabellen ingen ændringer, kun en opdatering af dataene i databasen. Det samme gælder stort set analysedata, der også kan gemmes i Chado.

De eksisterende kernemoduler i Chado er:

  • sekvens - til sekvenser / funktioner
  • cv - til kontrollerede vokabs / ontologier
  • generelt - i øjeblikket bare dbxrefs
  • organisme - taksonomiske data
  • pub - publikation og referencer
  • companalysis - udvider sekvensmodul med beregningsanalysedata
  • kort - ikke-sekvens kort
  • genetiske - genetiske og fænotypiske data
  • ekspression - genekspression
  • naturlig mangfoldighed - befolkningsdata

Software

Den komplette liste over GMOD-softwarekomponenter findes på siden GMOD-komponenter. Disse komponenter inkluderer:

  • GMOD Core (Chado-database og -værktøjer)
    • Chado: Chado-skemaet og værktøjer til at installere det.
    • XORT: et værktøj til indlæsning og dumpning af chado-xml
    • GMODTools: ekstraherer data fra en Chado-database til almindelige genom-bulkformater (GFF, Fasta osv.)
  • MOD-websted
    • Tripal: en web-frontend baseret på Drupal .
  • Genomredigering og visualisering
    • Apollo: et Java-program til visning og redigering af genomkommentarer
    • GBrowse: et CGI-program til visning af genomkommentarer
    • JBrowse: en JavaScript-applikation til visning af genomkommentarer
    • Pathway Tools : en genombrowser med en sammenlignende tilstand
  • Comparative Genomics
    • GBrowse_syn: en GBrowse-baseret synteny-fremviser
    • CMap: et CGI-program til visning af sammenlignende kort
  • Litteratur curation
    • Textpresso: et tekstminesystem til videnskabelig litteratur
  • Database forespørgsel værktøjer
    • BioMart : et forespørgselsorienteret datastyringssystem
    • InterMine : open source data warehouse system
  • Biologiske veje
    • Pathway Tools: værktøjer til metabolisk pathway information og analyse af high-throughput funktionelle genomiske data
  • Regulerende netværk
    • Pathway Tools: understøtter definition af lovgivningsmæssig interaktion og gennemsøgning af reguleringsnetværk
  • Analyse

BioMartLogo.png

Deltagende databaser

Følgende organisme databaser bidrager til og / eller vedtager GMOD komponenter til modelorganismer databaser.

ANISEED AntonosporaDB Arabidopsis
Beebase BeetleBase Bovint genomdatabase (BGD)
BioHealthBase Kvæg QTL Viewer EST-genfamiliedatabase for kvæg
CGD CGL ChromDB
Kromosom 7-kommentarprojekt CSHLmpd Database over genomiske varianter
DictyBase DroSpeGe EcoCyc
FlyBase Svampe-komparativ genomik Svampetelomerbrowser
Gallus genombrowser GeneDB KornGener
Gramene HapMap Menneske 2q33
Database for segmentering af humant genom IVDB MAGI
Marine Biological Lab Organism Databases Musgenominformatik Ikke-menneskelig segmenterings duplikatdatabase
OMAP OryGenesDB Oryza-kromosom 8
Vejværktøjer ParameciumDB PeanutMap
PlanterDB PlasmoDB PomBase
PseudoCAP PossumBase PUMTilføj
Rotte genomdatabase Saccharomyces genomdatabase SGD Lite
SmedDB Sol Genomics-netværk Sojabase
Soybean Gbrowse-database T1DBase Arabidopsis informationsressource
TGD Genominstituttet Institut for genomisk forskning
TIGR Browser til risgenom ToxoDB TriAnnot BAC Viewer
VectorBase wFleaBase WormBase
XanthusBase Xenbase

Relaterede projekter

Se også

Referencer

eksterne links