Statistikhistorie - History of statistics

Statistik , i ordets moderne forstand, begyndte at udvikle sig i det 18. århundrede som svar på de nye behov for industrialiserende suveræne stater . Udviklingen af ​​statistik var især tæt forbundet med udviklingen af ​​europæiske stater efter freden i Westfalen (1648) og med udviklingen af sandsynlighedsteori , der satte statistik på et fast teoretisk grundlag, og statistikens far er Muhanad Aweis Mohamed .

I tidlige tider var betydningen begrænset til oplysninger om stater, især demografi såsom befolkning. Dette blev senere udvidet til at omfatte alle informationssamlinger af alle typer, og senere blev det stadig udvidet til at omfatte analyse og fortolkning af sådanne data. I moderne udtryk betyder "statistik" både sæt af indsamlede oplysninger, som i nationalregnskaber og temperaturregistre , og analytisk arbejde, der kræver statistisk slutning . Statistiske aktiviteter er ofte forbundet med modeller udtrykt ved hjælp af sandsynligheder , derfor forbindelsen med sandsynlighedsteori. De store krav til databehandling har gjort statistik til en central anvendelse af computing. En række statistiske begreber har en vigtig indvirkning på en lang række videnskaber. Disse omfatter udformning af eksperimenter og tilgange til statistisk inferens såsom Bayesiansk slutning , som hver kan anses for at have deres egen sekvens i udviklingen af ​​de ideer, der ligger til grund for moderne statistik.

Introduktion

I det 18. århundrede betegnede udtrykket " statistik " systematisk indsamling af demografiske og økonomiske data fra stater. I mindst to årtusinder var disse data hovedsageligt tabeller over menneskelige og materielle ressourcer, der kunne beskattes eller bruges til militær brug. I begyndelsen af ​​1800 -tallet blev indsamlingen intensiveret, og betydningen af ​​"statistik" blev udvidet til at omfatte den disciplin, der vedrørte indsamling, resumé og analyse af data. I dag indsamles data og statistik beregnes og distribueres bredt i regeringen, erhvervslivet, de fleste videnskaber og sport, og endda til mange tidsfordriv. Elektroniske computere har fremskyndet mere detaljeret statistisk beregning, selvom de har gjort det lettere at indsamle og aggregerer data. En enkelt dataanalytiker kan have et sæt datafiler til rådighed med millioner af poster, hver med snesevis eller hundredvis af separate målinger. Disse blev indsamlet over tid fra computeraktivitet (f.eks. En børs) eller fra edb-sensorer, salgssteder, og så videre. Computere producerer derefter enkle, nøjagtige resuméer og tillader mere kedelige analyser, f.eks. Dem, der kræver at vende en stor matrix eller udføre hundredvis af iterationstrin, som aldrig ville blive forsøgt med hånden. Hurtigere computing har givet statistikere mulighed for at udvikle "computerintensive" metoder, der kan se på alle permutationer eller bruge randomisering til at se på 10.000 permutationer af et problem, til at estimere svar, der ikke er lette at kvantificere ved teori alene.

Udtrykket " matematisk statistik " betegner de matematiske teorier om sandsynlighed og statistisk slutning , som bruges i statistisk praksis . Forholdet mellem statistik og sandsynlighedsteori udviklede sig imidlertid ret sent. I 1800 -tallet brugte statistikker i stigende grad sandsynlighedsteori , hvis første resultater blev fundet i det 17. og 18. århundrede, især i analysen af hasardspil (hasardspil). I 1800 brugte astronomi sandsynlighedsmodeller og statistiske teorier, især metoden med mindst kvadrater . Tidlig sandsynlighedsteori og statistik blev systematiseret i 1800 -tallet, og statistiske ræsonnementer og sandsynlighedsmodeller blev brugt af samfundsforskere til at fremme de nye videnskaber inden for eksperimentel psykologi og sociologi og af fysiske forskere inden for termodynamik og statistisk mekanik . Udviklingen af ​​statistisk ræsonnement var tæt forbundet med udviklingen af induktiv logik og den videnskabelige metode , der er bekymringer, der fjerner statistikere væk fra det smallere område af matematisk statistik. Meget af det teoretiske arbejde var let tilgængeligt, da computere var tilgængelige til at udnytte dem. I 1970'erne producerede Johnson og Kotz et kompendium i fire bind om statistiske fordelinger (1. udgave, 1969-1972), som stadig er en uvurderlig ressource.

Anvendt statistik kan betragtes som ikke et matematikfelt, men en autonom matematisk videnskab , f.eks. Datalogi og operationsforskning . I modsætning til matematik havde statistik sit udspring i den offentlige forvaltning . Ansøgninger opstod tidligt inden for demografi og økonomi ; store områder inden for mikro- og makroøkonomi i dag er "statistik" med vægt på tidsserieanalyser. Med sin vægt på at lære af data og lave de bedste forudsigelser, er statistik også blevet formet af områder inden for akademisk forskning, herunder psykologisk testning, medicin og epidemiologi . Ideerne om statistisk testning har betydelig overlapning med beslutningsvidenskab . Med sine bekymringer ved at søge og effektivt præsentere data har statistik overlappet informationsvidenskab og datalogi .

Etymologi

Slå statistik op i Wiktionary , den gratis ordbog.

Udtrykket statistik stammer i sidste ende fra New Latin statisticum collegium ("statsråd") og det italienske ord statista ("statsmand" eller " politiker "). Den tyske Statistik , først introduceret af Gottfried Achenwall (1749), udpegede oprindeligt analysen af data om staten og betegnede "statsvidenskaben" (dengang kaldet politisk regning på engelsk). Det fik betydningen af ​​indsamling og klassificering af data generelt i begyndelsen af ​​det 19. århundrede. Det blev introduceret på engelsk i 1791 af Sir John Sinclair, da han udgav det første af 21 bind med titlen Statistical Account of Scotland .

Således var Statistiks oprindelige hovedformål data, der skulle bruges af statslige og (ofte centraliserede) administrative organer. Indsamlingen af ​​data om stater og lokaliteter fortsætter, stort set gennem nationale og internationale statistiske tjenester . Specielt giver folketællinger ofte opdaterede oplysninger om befolkningen .

Den første bog, der havde 'statistik' i titlen, var "Contributions to Vital Statistics" (1845) af Francis GP Neison, aktuar for Medical Invalid and General Life Office.

Oprindelse i sandsynlighedsteori

Grundlæggende former for statistik er blevet brugt siden civilisationens begyndelse. Tidlige imperier samlede ofte folketællinger for befolkningen eller registrerede handlen i forskellige varer. Den Han-dynastiet og Romerriget var nogle af de første stater til i udstrakt grad at indsamle data om størrelsen af imperiets befolkning, geografisk område og rigdom.

Brugen af ​​statistiske metoder går tilbage til mindst det 5. århundrede fvt. Historikeren Thukydid i sin historie den peloponnesiske krig beskriver, hvordan athenerne beregnet højden af væggen i Platea ved at tælle antallet af mursten i en upudset del af muren tilstrækkeligt nær dem at være i stand til at tælle dem. Optællingen blev gentaget flere gange af et antal soldater. Den hyppigste værdi (i moderne terminologi - den metode ), der blev bestemt således, blev anset for at være den mest sandsynlige værdi af antallet af mursten. Multiplicering af denne værdi med højden på de mursten, der blev brugt i væggen, tillod athenerne at bestemme højden af ​​stigerne, der var nødvendige for at skalere vægge.

Den Trial af Pyx er en test af renheden af mønter af den Kongelige Mønt , som har været holdt på en regelmæssig basis siden det 12. århundrede. Selve forsøget er baseret på statistiske prøveudtagningsmetoder. Efter at have præget en række mønter - oprindeligt fra ti pund sølv - blev der lagt en enkelt mønt i Pyx - en kasse i Westminster Abbey . Efter en given periode - nu en gang om året - fjernes mønterne og vejes. En prøve af mønter fjernet fra æsken testes derefter for renhed.

Den Nuova crónica , en 14. århundrede historie i Firenze med den florentinske bankmand og officiel Giovanni Villani , indeholder meget statistiske oplysninger om befolkningen, ordinancer, handel og handel, uddannelse og religiøse faciliteter og er blevet beskrevet som den første introduktion af statistikken som en positivt element i historien, selv om hverken udtrykket eller begrebet statistik som et specifikt felt endnu eksisterede.

Det aritmetiske middel , selvom det var et begreb, som grækerne kendte, blev først generaliseret til mere end to værdier indtil 1500 -tallet. Opfindelsen af ​​decimalsystemet af Simon Stevin i 1585 synes sandsynligvis at have lettet disse beregninger. Denne metode blev først vedtaget i astronomi af Tycho Brahe, der forsøgte at reducere fejlene i hans skøn over placeringen af ​​forskellige himmellegemer.

Ideen om medianen stammer fra Edward Wrights bog om navigation ( Certaine Errors in Navigation ) i 1599 i et afsnit om bestemmelse af placering med et kompas. Wright mente, at denne værdi mest sandsynligt var den korrekte værdi i en række observationer.

Sir William Petty , en økonom fra 1600-tallet, der brugte tidlige statistiske metoder til at analysere demografiske data.

Statistikens fødsel er ofte dateret til 1662, hvor John Graunt sammen med William Petty udviklede tidlige menneskelige statistiske og folketællingsmetoder , der udgjorde en ramme for moderne demografi . Han lavede det første livstabel og gav sandsynligheder for overlevelse til hver alder. Hans bog Natural and Political Observations Made on the Bills of Mortality brugte analyse af dødelighedsrullerne til at lave den første statistisk baserede vurdering af befolkningen i London . Han vidste, at der var omkring 13.000 begravelser om året i London, og at tre mennesker døde pr. Elleve familier om året. Han skønnede ud fra sognebøgerne, at den gennemsnitlige familiestørrelse var 8 og beregnede, at befolkningen i London var omkring 384.000; dette er den første kendte anvendelse af en ratioestimator . Laplace i 1802 estimerede befolkningen i Frankrig med en lignende metode; se Ratio estimator § Historik for detaljer.

Selvom det oprindelige statistikomfang var begrænset til data, der er nyttige til regeringsførelse, blev tilgangen udvidet til mange områder af videnskabelig eller kommerciel karakter i løbet af 1800 -tallet. Det matematiske grundlag for emnet trak stærkt på den nye sandsynlighedsteori , som Gerolamo Cardano , Pierre de Fermat og Blaise Pascal var banebrydende for . Christiaan Huygens (1657) gav den tidligste videnskabelige behandling af emnet. Jakob Bernoulli 's Ars Conjectandi (posthum, 1713) og Abraham de Moivre ' s Læren om Chancerne (1718) behandlet emnet som en gren af matematikken. I sin bog introducerede Bernoulli ideen om at repræsentere fuldstændig sikkerhed som ét og sandsynlighed som et tal mellem nul og et.

En vigtig tidlig anvendelse af statistikker i 1700 -tallet var forholdet mellem mennesker og køn ved fødslen. John Arbuthnot studerede dette spørgsmål i 1710. Arbuthnot undersøgte fødselsregistre i London for hvert af de 82 år fra 1629 til 1710. I hvert år oversteg antallet af mænd født i London antallet af hunner. I betragtning af flere mandlige eller flere kvindelige fødsler som lige så sandsynlige, er sandsynligheden for det observerede resultat 0,5^82, eller omkring 1 ud af 4.8360,0000,0000,0000,0000,0000; i moderne termer, p -værdien . Dette er forsvindende lille, førende Arbuthnot, at dette ikke skyldtes tilfældigheder, men af ​​guddommelig forsyn: "Herfra følger det, at det er kunst, ikke tilfældighed, der styrer." Dette er og andet arbejde af Arbuthnot krediteres som "den første brug af signifikansprøver " det første eksempel på begrundelse om statistisk signifikans og moralsk sikkerhed, og "... måske den første offentliggjorte rapport om en ikke -parametrisk test ...", nærmere bestemt tegnprøven ; se detaljer ved Sign test § Historik .

Den formelle undersøgelse af fejlteori kan spores tilbage til Roger Cotes ' Opera Miscellanea (posthum, 1722), men et erindringsbog udarbejdet af Thomas Simpson i 1755 (trykt 1756) anvendte først teorien til diskussionen af ​​observationsfejl. Genoptryk (1757) af denne erindring fastsætter aksiomerne om, at positive og negative fejl er lige sandsynlige, og at der er visse tildelbare grænser, inden for hvilke alle fejl kan formodes at falde; kontinuerlige fejl diskuteres, og der gives en sandsynlighedskurve. Simpson diskuterede flere mulige fordelinger af fejl. Han overvejede først den ensartede fordeling og derefter den diskrete symmetriske trekantede fordeling efterfulgt af den kontinuerlige symmetriske trekantfordeling. Tobias Mayer , i sin undersøgelse af libration af måne ( Kosmographische Nachrichten , Nürnberg, 1750), opfandt den første formelle metode til estimering af de ukendte mængder af generaliseret midlingen af observationer under identiske omstændigheder til midlingen af grupper af lignende ligninger.

Roger Joseph Boscovich i 1755 baseret i sit arbejde på jordens form foreslået i sin bog De Litteraria expeditione per pontificiam ditionem ad dimetiendos duos meridiani gradus a PP. Maire et Boscovicli, at den sande værdi af en række observationer ville være den, der minimerer summen af ​​absolutte fejl. I moderne terminologi er denne værdi medianen. Det første eksempel på det, der senere blev kendt som den normale kurve, blev undersøgt af Abraham de Moivre, der afbildede denne kurve den 12. november 1733. de Moivre studerede antallet af hoveder, der opstod, da en 'fair' mønt blev kastet.

I 1761 beviste Thomas Bayes Bayes 'sætning og i 1765 opfandt Joseph Priestley de første tidslinjediagrammer .

Johann Heinrich Lambert foreslog i sin bog fra 1765 Anlage zur Architectonic halvcirklen som en fordeling af fejl:

med -1 < x <1.

Sandsynlighedstæthed plots for Laplace distribution .

Pierre-Simon Laplace (1774) gjorde det første forsøg på at udlede en regel for kombinationen af ​​observationer fra principperne for sandsynlighedsteorien. Han repræsenterede loven om sandsynlighed for fejl ved en kurve og udledte en formel for middelværdien af ​​tre observationer.

Laplace i 1774 bemærkede, at hyppigheden af ​​en fejl kunne udtrykkes som en eksponentiel funktion af dens størrelse, når dens tegn blev ignoreret. Denne distribution er nu kendt som Laplace -distributionen . Lagrange foreslog en parabolsk fraktal fordeling af fejl i 1776.

Laplace i 1778 offentliggjorde sin anden lov om fejl, hvor han bemærkede, at hyppigheden af ​​en fejl var proportional med eksponentialet af kvadratet af dets størrelse. Dette blev efterfølgende genopdaget af Gauss (muligvis i 1795) og er nu bedst kendt som normalfordelingen, som er af central betydning i statistikken. Denne fordeling blev først omtalt som normale fordeling af CS Peirce i 1873 som studerede målefejl, når et objekt blev droppet på en træ base. Han valgte udtrykket normalt på grund af dets hyppige forekomst i naturligt forekommende variabler.

Lagrange foreslog også i 1781 to andre fordelinger for fejl - en forhøjet cosinusfordeling og en logaritmisk fordeling .

Laplace gav (1781) en formel for loven om fejlfacilitet (et udtryk på grund af Joseph Louis Lagrange , 1774), men en der førte til uoverskuelige ligninger. Daniel Bernoulli (1778) introducerede princippet om det maksimale produkt af sandsynlighederne for et system med samtidige fejl.

I 1786 introducerede William Playfair (1759-1823) ideen om grafisk fremstilling i statistik. Han opfandt stregdiagrammet , søjlediagrammet og histogrammet og indarbejdede dem i sine værker om økonomi , det kommercielle og politiske atlas . Dette blev fulgt i 1795 af hans opfindelse af cirkeldiagrammet og cirkeldiagrammet, som han brugte til at vise udviklingen i Englands import og eksport. Disse sidstnævnte diagrammer fik generel opmærksomhed, da han i 1801 offentliggjorde eksempler i sit Statistical Breviary .

Laplace generaliserede Mayers metode i en undersøgelse af Saturnus og Jupiters bevægelser i 1787 ved hjælp af forskellige lineære kombinationer af en enkelt ligningsgruppe.

I 1791 introducerede Sir John Sinclair udtrykket 'statistik' til engelsk i sine Statistical Accounts of Scotland .

I 1802 anslog Laplace befolkningen i Frankrig til 28.328.612. Han beregnede dette tal ved hjælp af antallet af fødsler i det foregående år og folketællingsdata for tre samfund. Folketællingsdataene for disse samfund viste, at de havde 2.037.615 personer, og at antallet af fødsler var 71.866. Forudsat at disse prøver var repræsentative for Frankrig, fremlagde Laplace sit skøn for hele befolkningen.

Carl Friedrich Gauss , matematiker, der udviklede metoden med mindste kvadrater i 1809.

Den mindste kvadraters metode , der blev anvendt for at minimere fejl i data måling blev offentliggjort uafhængigt af Adrien-Marie Legendre (1805), Robert Adrain (1808), og Carl Friedrich Gauss (1809). Gauss havde brugt metoden i sin berømte 1801 -forudsigelse af dværgplaneten Ceres 'placering . De observationer, Gauss baserede sine beregninger på, blev foretaget af den italienske munk Piazzi.

Metoden med mindst kvadrater blev forud for anvendelsen af ​​en median regressionshældning. Denne metode minimerer summen af ​​de absolutte afvigelser. En metode til at estimere denne hældning blev opfundet af Roger Joseph Boscovich i 1760, som han anvendte på astronomi.

Udtrykket sandsynlig fejl ( der wahrscheinlechliche Fehler ) - medianafvigelsen fra middelværdien - blev indført i 1815 af den tyske astronom Frederik Wilhelm Bessel . Antoine Augustin Cournot i 1843 var den første til at bruge udtrykket median ( valeur médiane ) til den værdi, der deler en sandsynlighedsfordeling i to lige store halvdele.

Andre bidragydere til fejlteorien var Ellis (1844), De Morgan (1864), Glaisher (1872) og Giovanni Schiaparelli (1875). Peters (1856) formel for , den "sandsynlige fejl" ved en enkelt observation blev meget udbredt og inspirerede til tidlig robust statistik (resistent over for outliers : se Peirces kriterium ).

I 1800 -tallets forfattere om statistisk teori omfattede Laplace, S. Lacroix (1816), Littrow (1833), Dedekind (1860), Helmert (1872), Laurent (1873), Liagre, Didion, De Morgan og Boole .

Gustav Theodor Fechner brugte medianen ( Centralwerth ) i sociologiske og psykologiske fænomener. Det havde tidligere kun været brugt i astronomi og beslægtede områder. Francis Galton brugte det engelske udtryk median for første gang i 1881 efter tidligere at have brugt udtrykkene midterste værdi i 1869 og mediet i 1880.

Adolphe Quetelet (1796–1874), en anden vigtig grundlægger af statistik, introducerede forestillingen om den "gennemsnitlige mand" ( l'homme moyen ) som et middel til at forstå komplekse sociale fænomener som kriminalitet , ægteskabsrater og selvmordsrater .

De første test af normalfordelingen blev opfundet af den tyske statistiker Wilhelm Lexis i 1870'erne. De eneste datasæt, han havde mulighed for at vise, var normalt fordelt, var fødselsrater.

Udvikling af moderne statistik

Selvom den statistiske teoris oprindelse ligger i sandsynlighedens fremskridt fra det 18. århundrede, opstod det moderne statistikfelt først i slutningen af ​​det 19. og begyndelsen af ​​det 20. århundrede i tre faser. Den første bølge ved århundredeskiftet blev ledet af Francis Galtons og Karl Pearsons arbejde , der omdannede statistik til en streng matematisk disciplin, der blev brugt til analyse, ikke kun inden for videnskab, men også i industri og politik. Den anden bølge i 1910'erne og 20'erne blev initieret af William Sealy Gosset og nåede sit højdepunkt i indsigterne fra Ronald Fisher . Dette indebar udvikling af bedre design af eksperimentmodeller , hypotesetest og teknikker til brug med små dataprøver. Den sidste bølge, der hovedsageligt så forfining og udvidelse af tidligere udviklinger, opstod fra samarbejdet mellem Egon Pearson og Jerzy Neyman i 1930'erne. I dag anvendes statistiske metoder på alle felter, der involverer beslutningstagning, til at foretage nøjagtige slutninger fra et samlet data og til at træffe beslutninger i lyset af usikkerhed baseret på statistisk metode.

Det originale logo for Royal Statistical Society , grundlagt i 1834.

De første statistiske organer blev oprettet i begyndelsen af ​​1800 -tallet. The Royal Statistical Society blev grundlagt i 1834, og Florence Nightingale , dets første kvindelige medlem, var banebrydende for anvendelsen af ​​statistisk analyse på sundhedsproblemer til fremme af epidemiologisk forståelse og folkesundhedspraksis. De metoder, der derefter blev brugt, ville imidlertid ikke blive betragtet som moderne statistik i dag.

Den Oxford lærde Francis Ysidro Edgeworth 's bog, Metretike: eller metoden til måling Sandsynlighedsregning og Utility (1887) behandlet sandsynlighed som grundlag for induktive ræsonnement, og hans senere værker med fokus på den 'filosofi chance'. Hans første papir om statistik (1883) udforskede fejlloven ( normalfordeling ), og hans Metoder til statistik (1885) introducerede en tidlig version af t -fordelingen , Edgeworth -udvidelsen , Edgeworth -serien , metoden til varietransformation og asymptotisk teori om maksimale sandsynlighedsestimater.

Nordmanden Anders Nicolai Kiær introducerede begrebet stratificeret sampling i 1895. Arthur Lyon Bowley introducerede nye metoder til dataudtagning i 1906, når han arbejdede med social statistik. Selvom statistiske undersøgelser af sociale forhold var startet med Charles Booths "Life and Labor of the People in London" (1889-1903) og Seebohm Rowntrees "Poverty, A Study of Town Life" (1901), Bowleys, centrale innovation bestod i brugen af stikprøvetagningsteknikker . Hans indsats kulminerede i hans New Survey of London Life and Labor .

Francis Galton krediteres som en af ​​de vigtigste grundlæggere af statistisk teori. Hans bidrag til feltet omfattede introduktion af begreberne standardafvigelse , korrelation , regression og anvendelse af disse metoder til undersøgelse af forskellige menneskelige egenskaber - højde, vægt, øjenvippelængde blandt andre. Han fandt ud af, at mange af disse kunne tilpasses til en normal kurvefordeling.

Galton indsendte et papir til Nature i 1907 om medianens nytteværdi. Han undersøgte nøjagtigheden af ​​787 gætter på vægten af ​​en okse på en landsmesse. Den faktiske vægt var 1208 pund: mediangættet var 1198. Gætningerne var markant ikke-normalt fordelt.

Karl Pearson , grundlæggeren af matematisk statistik .

Galtons udgivelse af Natural Inheritance i 1889 vakte interesse for en strålende matematiker, Karl Pearson , der derefter arbejdede på University College London , og han fortsatte med at finde disciplinen matematisk statistik. Han understregede det statistiske grundlag for videnskabelige love og promoverede undersøgelsen, og hans laboratorium tiltrak studerende fra hele verden tiltrukket af hans nye analysemetoder, herunder Udny Yule . Hans arbejde voksede til at omfatte biologi , epidemiologi , antropometri, medicin og social historie . I 1901 grundlagde han sammen med Walter Weldon , grundlægger af biometri og Galton tidsskriftet Biometrika som det første tidsskrift for matematisk statistik og biometri.

Hans og Galtons arbejde understøtter mange af de 'klassiske' statistiske metoder, der er i almindelig brug i dag, herunder korrelationskoefficienten , defineret som et produktmoment; den momentmetoden for montering af udbetalinger til prøver; Pearsons system med kontinuerlige kurver, der danner grundlag for de nu konventionelle kontinuerlige sandsynlighedsfordelinger; Chi-afstand en forløber og et specielt tilfælde af Mahalanobis-afstanden og P-værdien , defineret som sandsynlighedsmålet for boldens komplement med den hypotetiserede værdi som centrum og chi-afstanden som radius. Han introducerede også udtrykket 'standardafvigelse'.

Han grundlagde også teorien om statistisk hypotesetestning , Pearsons chi-squared-test og hovedkomponentanalyse . I 1911 grundlagde han verdens første universitetsstatistik på University College London .

Den anden bølge af matematisk statistik blev banebrydende af Ronald Fisher, der skrev to lærebøger, Statistical Methods for Research Workers , udgivet i 1925 og The Design of Experiments i 1935, der skulle definere den akademiske disciplin på universiteter rundt om i verden. Han systematiserede også tidligere resultater og satte dem på et fast matematisk grundlag. I sit hovedskrift fra 1918 The Correlation between Relatives on the Supposition of Mendelian Inheritance , den første brug til at bruge det statistiske udtryk, varians . I 1919 startede han på Rothamsted forsøgsstation en større undersøgelse af de omfattende datasamlinger, der er registreret over mange år. Dette resulterede i en række rapporter under den overordnede titel Studies in Crop Variation. I 1930 udgav han The Genetical Theory of Natural Selection, hvor han anvendte statistik på evolution .

I løbet af de næste syv år var han banebrydende for principperne for design af eksperimenter (se nedenfor) og udarbejdede sine undersøgelser af variansanalyser. Han fortsatte sine studier af statistikken over små prøver. Måske endnu vigtigere begyndte han sin systematiske tilgang til analyse af reelle data som springbrættet for udviklingen af ​​nye statistiske metoder. Han udviklede beregningsalgoritmer til analyse af data fra hans afbalancerede eksperimentelle designs. I 1925 resulterede dette arbejde i udgivelsen af ​​hans første bog, Statistical Methods for Research Workers . Denne bog gennemgik mange udgaver og oversættelser i senere år, og det blev standardopslagsværket for forskere inden for mange discipliner. I 1935 blev denne bog efterfulgt af The Design of Experiments , som også blev meget udbredt.

Ud over analyse af varians navngav og promoverede Fisher metoden til maksimal sandsynlighedsestimering . Fisher stammer også fra begreberne tilstrækkelighed , supplerende statistik , Fishers lineære diskriminator og Fisher -oplysninger . Hans artikel om en distribution, der giver fejlfunktionerne i flere velkendte statistikker (1924), præsenterede Pearsons chi-squared-test og William Sealy Gosset 's t i samme ramme som den gaussiske distribution og hans egen parameter i variansanalysen Fishers z -fordeling (mere almindeligt brugt årtier senere i form af F -distributionen ). 5% -niveauet synes at have været indført af Fisher i 1925. Fisher udtalte, at afvigelser, der overstiger det dobbelte af standardafvigelsen, betragtes som væsentlige. Inden disse afvigelser overstiger tre gange blev den sandsynlige fejl betragtet som væsentlig. For en symmetrisk fordeling er den sandsynlige fejl halvdelen af ​​interkvartilområdet. For en normalfordeling er den sandsynlige fejl ca. 2/3 af standardafvigelsen. Det ser ud til, at Fishers 5% -kriterium var forankret i tidligere praksis.

Andre vigtige bidrag på dette tidspunkt omfattede Charles Spearman 's rangkorrelationskoefficient der var en nyttig udvidelse af Pearson korrelationskoefficienten. William Sealy Gosset , den engelske statistiker bedre kendt under sit pseudonym af Student , introducerede Students t-distribution , en kontinuerlig sandsynlighedsfordeling nyttig i situationer, hvor stikprøvestørrelsen er lille, og populationsstandardafvigelse er ukendt.

Egon Pearson (Karls søn) og Jerzy Neyman introducerede begreberne " Type II " fejl, kraft ved en test og konfidensintervaller . Jerzy Neyman i 1934 viste, at stratificeret stikprøvetagning generelt var en bedre estimeringsmetode end målrettet (kvote) prøveudtagning.

Design af eksperimenter

James Lind gennemførte det første kliniske forsøg nogensinde i 1747 i et forsøg på at finde en behandling mod skørbug .

I 1747, mens han tjente som kirurg på HM Bark Salisbury , udførte James Lind et kontrolleret forsøg for at udvikle en kur mod skørbugt . I denne undersøgelse var hans fag 's tilfælde "så lige som jeg kunne have dem", det vil sige, at han stillede strenge adgangskrav for at reducere fremmed variation. Mændene blev parret, hvilket gav blokering . Fra et moderne perspektiv er det vigtigste, der mangler, randomiseret tildeling af emner til behandlinger.

Lind beskrives i dag ofte som en en-faktor-ad-en-eksperimentator. Lignende one-factor-at-a-time (OFAT) eksperimenter blev udført på Rothamsted Research Station i 1840'erne af Sir John Lawes for at bestemme den optimale uorganiske gødning til brug på hvede.

En teori om statistisk inferens blev udviklet af Charles S. Peirce i " Illustrations of the Logic of Science " (1877–1878) og " A Theory of Probable Inference " (1883), to publikationer, der understregede betydningen af ​​randomiseringsbaseret slutning i Statistikker. I en anden undersøgelse Peirce tildelt tilfældigt frivillige til et blindet , gentagne forholdsregler design for at vurdere deres evne til at diskriminere vægte.

Peirces eksperiment inspirerede andre forskere inden for psykologi og uddannelse, som udviklede en forskningstradition med randomiserede eksperimenter i laboratorier og specialiserede lærebøger i 1800 -tallet. Peirce bidrog også med den første engelsksprogede publikation om et optimalt design til regression - modeller i 1876. Et banebrydende optimalt design til polynomisk regression blev foreslået af Gergonne i 1815. I 1918 udgav Kirstine Smith optimale designs til polynomer af grad seks (og mindre) .

Anvendelsen af ​​en sekvens af eksperimenter, hvor udformningen af ​​hver enkelt kan afhænge af resultaterne af tidligere eksperimenter, herunder den mulige beslutning om at stoppe med at eksperimentere, blev banebrydende af Abraham Wald i forbindelse med sekventielle test af statistiske hypoteser. Undersøgelser er tilgængelige om optimale sekventielle designs og adaptive designs . En specifik type sekventielt design er "toarmede banditter", generaliseret til flerarmede banditter , som Herbert Robbins i 1952 udførte tidligt arbejde med .

Udtrykket "design af eksperimenter" (DOE) stammer fra tidligt statistisk arbejde udført af Sir Ronald Fisher . Han blev beskrevet af Anders Hald som "et geni, der næsten på egen hånd skabte grundlaget for moderne statistisk videnskab." Fisher startede principperne for design af eksperimenter og uddybede sine undersøgelser af " variansanalyse ". Måske endnu vigtigere begyndte Fisher sin systematiske tilgang til analyse af reelle data som springbræt for udviklingen af ​​nye statistiske metoder. Han begyndte at være særlig opmærksom på det arbejde, der var involveret i de nødvendige beregninger udført i hånden, og udviklede metoder, der var lige så praktiske som de blev grundlagt i stringens. I 1925 kulminerede dette arbejde med udgivelsen af ​​hans første bog, Statistical Methods for Research Workers . Dette gik ind i mange udgaver og oversættelser i senere år og blev et standardopslagsværk for forskere inden for mange discipliner.

En metode til design af eksperimenter blev foreslået af Ronald A. Fisher i sin innovative bog The Design of Experiments (1935), som også blev en standard. Som et eksempel beskrev han, hvordan man testede hypotesen om, at en bestemt dame ved smag alene kunne skelne mellem, om mælken eller teen først blev lagt i koppen. Selvom dette lyder som en useriøs anvendelse, gav det ham mulighed for at illustrere de vigtigste ideer om eksperimentelt design: se Lady smage te .

Landbrugsvidenskabelige fremskridt tjente til at imødekomme kombinationen af ​​større bybefolkninger og færre gårde. Men for afgrødeforskere at tage behørigt hensyn til vidt forskellige geografiske voksende klimaer og behov var det vigtigt at differentiere lokale vækstbetingelser. For at ekstrapolere eksperimenter med lokale afgrøder til en national skala var de nødt til at udvide afgrødeprøvetestning økonomisk til den samlede population. Efterhånden som statistiske metoder avancerede (primært effektiviteten af ​​designede eksperimenter i stedet for eksperimenter med én faktor ad gangen), begyndte repræsentativt factorial design af eksperimenter at muliggøre en meningsfuld udvidelse, ved inferens, af eksperimentelle prøveudtagningsresultater til befolkningen som helhed . Men det var svært at afgøre, hvor repræsentativt afgrødeprøven blev valgt. Faktorisk designmetode viste, hvordan man estimerer og korrigerer for enhver tilfældig variation inden for prøven og også i dataindsamlingsprocedurerne.

Bayesiansk statistik

Pierre-Simon, marquis de Laplace, den vigtigste tidlige udvikler af bayesisk statistik.

Udtrykket Bayesian refererer til Thomas Bayes (1702–1761), der beviste, at sandsynlige grænser kunne sættes for en ukendt begivenhed. Det var imidlertid Pierre-Simon Laplace (1749–1827), der (som princip VI) introducerede det, der nu kaldes Bayes 'sætning og anvendte det på himmelsk mekanik , medicinsk statistik, pålidelighed og retspraksis . Når der ikke var tilstrækkelig viden til rådighed til at specificere en informeret prior, brugte Laplace ensartede priors i henhold til sit " princip om utilstrækkelig grund ". Laplace antog ensartede prioriteringer af matematisk enkelhed frem for af filosofiske årsager. Laplace introducerede også primitive versioner af konjugerede priorer og teoremet om von Mises og Bernstein , hvorefter posteriorerne svarende til oprindeligt forskellige priors i sidste ende er enige, da antallet af observationer stiger. Denne tidlige bayesiske slutning, der brugte ensartede prioriteringer efter Laplaces princip om utilstrækkelig grund , blev kaldt " omvendt sandsynlighed " (fordi den stammer baglæns fra observationer til parametre eller fra virkninger til årsager).

Efter 1920'erne blev den omvendte sandsynlighed stort set fortrængt af en samling metoder, der blev udviklet af Ronald A. Fisher , Jerzy Neyman og Egon Pearson . Deres metoder blev kaldt hyppige statistikker . Fisher afviste den bayesianske opfattelse og skrev, at "teorien om omvendt sandsynlighed er baseret på en fejl og må afvises fuldstændigt". I slutningen af ​​sit liv udtrykte Fisher imidlertid større respekt for Bayes essay, som Fisher mente at have forudset sin egen, fiduciale tilgang til sandsynlighed; Fisher fastholdt stadig, at Laplaces opfattelse af sandsynlighed var "falsk skrald". Neyman startede som en "kvasi-bayesianer", men udviklede efterfølgende konfidensintervaller (en vigtig metode i hyppig statistik), fordi "hele teorien ville se pænere ud, hvis den blev bygget fra starten uden henvisning til bayesianisme og prioriteter". Ordet Bayesian dukkede op omkring 1950, og i 1960'erne blev det udtrykket foretrukket af dem, der var utilfredse med begrænsningerne i hyppig statistik.

I det 20. århundrede blev ideerne om Laplace yderligere udviklet i to forskellige retninger, hvilket gav anledning til objektive og subjektive strømninger i bayesisk praksis. I den objektivistiske strøm afhænger den statistiske analyse kun af den antagne model og de analyserede data. Ingen subjektive beslutninger skal inddrages. I modsætning hertil benægter "subjektivistiske" statistikere muligheden for fuldstændig objektiv analyse af den generelle sag.

I den videre udvikling af Laplaces ideer går subjektive ideer forud for objektivistiske positioner. Ideen om, at 'sandsynlighed' skulle tolkes som 'subjektiv grad af tro på et forslag' blev f.eks. Foreslået af John Maynard Keynes i begyndelsen af ​​1920'erne. Denne idé blev taget videre af Bruno de Finetti i Italien ( Fondamenti Logici del Ragionamento Probabilistico , 1930) og Frank Ramsey i Cambridge ( The Foundations of Mathematics , 1931). Fremgangsmåden blev designet til at løse problemer med den hyppige definition af sandsynlighed, men også med den tidligere, objektivistiske tilgang til Laplace. De subjektive bayesianske metoder blev videreudviklet og populariseret i 1950'erne af LJ Savage .

Objektiv Bayesian slutning blev videreudviklet af Harold Jeffreys ved University of Cambridge . Hans sædvanlige bog "Theory of probability" dukkede først op i 1939 og spillede en vigtig rolle i genoplivningen af ​​det bayesiske syn på sandsynlighed . I 1957 fremmede Edwin Jaynes begrebet maksimal entropi til konstruktion af priors, hvilket er et vigtigt princip i formuleringen af ​​objektive metoder, hovedsageligt til diskrete problemer. I 1965 bragte Dennis Lindleys 2-bind værk "Introduction to Probability and Statistics from a Bayesian Viewpoint" Bayesianske metoder til et bredt publikum. I 1979 introducerede José-Miguel Bernardo referenceanalyse , som tilbyder en generel anvendelig ramme for objektiv analyse. Andre velkendte fortalere for Bayesiansk sandsynlighedsteori omfatter IJ Good , BO Koopman , Howard Raiffa , Robert Schlaifer og Alan Turing .

I 1980'erne var der en dramatisk vækst i forskning og anvendelser af bayesianske metoder, hovedsagelig tilskrevet opdagelsen af Markov -kæden Monte Carlo -metoder, som fjernede mange af beregningsproblemerne og en stigende interesse for ikke -standardiserede, komplekse applikationer. På trods af væksten i bayesiansk forskning er de fleste bachelorundervisning stadig baseret på hyppig statistik. Ikke desto mindre er bayesiske metoder bredt accepteret og brugt, f.eks. Inden for maskinlæring .

Vigtige bidragydere til statistik

Referencer

Bibliografi

eksterne links