Dataindsamling - Data collection

Eksempel på dataindsamling i de biologiske videnskaber: Adélie -pingviner identificeres og vejes hver gang de krydser den automatiserede vejbro på vej til eller fra havet.

Dataindsamling er processen med at indsamle og måle information om målrettede variabler i et etableret system, som derefter sætter en i stand til at besvare relevante spørgsmål og evaluere resultater. Dataindsamling er en forskningskomponent inden for alle studieretninger, herunder fysiske og sociale videnskaber , humaniora og erhvervsliv . Mens metoderne varierer efter disciplin, er vægten på at sikre præcis og ærlig indsamling den samme. Målet for al dataindsamling er at fange kvalitetsbevis, der gør det muligt for analyse at føre til formulering af overbevisende og troværdige svar på de stillede spørgsmål. Dataindsamling og validering består af fire trin, når det indebærer at tage en folketælling og syv trin, når det involverer stikprøveudtagning.

Uanset studieretning eller præference for at definere data ( kvantitativ eller kvalitativ ) er nøjagtig dataindsamling afgørende for at opretholde forskningsintegritet. Valget af passende dataindsamlingsinstrumenter (eksisterende, modificerede eller nyudviklede) og afgrænsede instruktioner for korrekt brug reducerer sandsynligheden for fejl .

En formel dataindsamlingsproces er nødvendig, da den sikrer, at de indsamlede data er både definerede og nøjagtige. På denne måde træffes efterfølgende beslutninger baseret på argumenter indeholdt i resultaterne ved hjælp af gyldige data. Processen giver både en basislinje, der skal måles fra, og i visse tilfælde en indikation af, hvad der skal forbedres.

Der er 5 almindelige dataindsamlingsmetoder:

  1. lukkede undersøgelser og quizzer,
  2. åbne undersøgelser og spørgeskemaer,
  3. 1-til-1 interviews,
  4. fokusgrupper , og
  5. direkte observation.

DMP'er og dataindsamling

DMP er forkortelsen for datahåndteringsplatform. Det er et centraliseret lagrings- og analysesystem til data. DMP'er, der hovedsageligt bruges af marketingfolk, findes til at kompilere og omdanne store mængder data til synlig information. Markedsførere ønsker måske at modtage og bruge data fra første, anden og tredjepart. DMP'er muliggør dette, fordi de er det samlede system af DSP'er (platform med efterspørgselsside) og SSP'er (platform på forsyningssiden). Når det kommer til reklame, er DMP'er integreret til optimering og vejledning af marketingfolk i fremtidige kampagner. Dette system og deres effektivitet er et bevis på, at kategoriserede, analyserede og kompilerede data er langt mere nyttige end rådata.

Dataindsamling på z/OS

z/OS er et meget udbredt operativsystem til IBM mainframe . Det er designet til at tilbyde et stabilt, sikkert og løbende tilgængeligt miljø for applikationer, der kører på mainframe. Driftsdata er data, som z/OS -systemet producerer, når de kører. Disse data angiver systemets tilstand og kan bruges til at identificere kilder til ydelse og tilgængelighedsproblemer i systemet. Analysen af ​​driftsdata foretaget af analyseplatforme giver indsigt og anbefalede handlinger for at få systemet til at fungere mere effektivt og til at hjælpe med at løse eller forhindre problemer. IBM Z Common Data Provider indsamler it -driftsdata fra z/OS -systemer, omdanner dem til et forbrugsformat og streamer dem til analyseplatforme.

IBM Z Common Data Provider understøtter indsamling af følgende driftsdata:

  • System Management Faciliteter (SMF) data
  • Log data fra følgende kilder:
    • Joblog, output som skrives til en datadefinition (DD) af et kørende job
    • z/OS UNIX -logfil, inklusive UNIX System Services systemlog (syslogd)
    • Entry-sequencer Virtual Storage Access Method (VSAM) klynge
    • z/OS systemlog (SYSLOG)
    • IBM Tivoli NetView til z/OS -meddelelser
    • IBM WebSphere Application Server til z/OS High Performance Extensible Logging (HPEL) log
    • IBM Resource Measurement Facility (RMF) Monitor III -rapporter
  • Brugerapplikationsdata, driftsdata fra brugernes egne applikationer

Problemer med dataintegritet

Hovedårsagen til at opretholde dataintegritet er at understøtte observation af fejl i dataindsamlingsprocessen. Disse fejl kan begås forsætligt (bevidst forfalskning) eller ikke-forsætligt ( tilfældige eller systematiske fejl ).

Der er to tilgange, der kan beskytte dataintegritet og sikre videnskabelig validitet af undersøgelsesresultater opfundet af Craddick, Crawford, Rhodes, Redican, Rukenbrod og Laws i 2003:

  • Kvalitetssikring - alle handlinger udført før dataindsamling
  • Kvalitetskontrol - alle handlinger udført under og efter dataindsamling

Kvalitetssikring

Dets hovedfokus er forebyggelse, som primært er en omkostningseffektiv aktivitet for at beskytte dataindsamlingens integritet. Standardisering af protokollen viser bedst denne omkostningseffektive aktivitet, som er udviklet i en omfattende og detaljeret proceduremanual for dataindsamling. Risikoen for ikke at identificere problemer og fejl i forskningsprocessen skyldes tydeligvis dårligt skrevne retningslinjer. Nedenfor er angivet flere eksempler på sådanne fejl:

  • Usikkerhed om timing, metoder og identifikation af den ansvarlige person
  • Delvis liste over genstande skulle indsamles
  • Uklar beskrivelse af dataindsamlingsinstrumenter i stedet for strenge trinvise instruktioner om administration af tests
  • Manglende anerkendelse af nøjagtigt indhold og strategier for uddannelse og efteruddannelse af medarbejdere, der er ansvarlige for dataindsamling
  • Uklare instruktioner til brug, justering og kalibrering af dataindsamlingsudstyr
  • Ingen forudbestemt mekanisme til at dokumentere ændringer i procedurer, der sker under undersøgelsen

Kvalitetskontrol

Da der foretages kvalitetskontrolhandlinger under eller efter dataindsamlingen, er alle detaljer omhyggeligt dokumenteret. Der er en nødvendighed for en klart defineret kommunikationsstruktur som forudsætning for etablering af overvågningssystemer. Usikkerhed om informationsstrømmen anbefales ikke, da en dårligt organiseret kommunikationsstruktur fører til slap overvågning og også kan begrænse mulighederne for at opdage fejl. Kvalitetskontrol er også ansvarlig for identifikation af handlinger, der er nødvendige for at korrigere fejlbehæftet dataindsamlingspraksis og minimere sådanne fremtidige hændelser. Et team er mere tilbøjelige til ikke at indse nødvendigheden af ​​at udføre disse handlinger, hvis deres procedurer er skrevet vagt og ikke er baseret på feedback eller uddannelse.

Dataindsamlingsproblemer, der kræver hurtig handling:

  • Systematiske fejl
  • Overtrædelse af protokollen
  • Bedrageri eller videnskabelig forseelse
  • Fejl i individuelle dataelementer
  • Individuelle medarbejdere eller webstedets ydelsesproblemer

Se også

Referencer

eksterne links