Gennemsnit - Average

I daglig tale er et gennemsnit et enkelt tal taget som repræsentant for en ikke-tom liste over tal. Forskellige begreber om gennemsnit bruges i forskellige sammenhænge. Ofte refererer "gennemsnit" til det aritmetiske middelværdi , summen af ​​tallene divideret med hvor mange tal der beregnes i gennemsnit. I statistik er middel , median og tilstand alle kendt som mål for central tendens , og i daglig tale kan nogen af ​​disse kaldes en gennemsnitsværdi .

Generelle egenskaber

Hvis alle tal i en liste er det samme tal, så er deres gennemsnit også lig med dette tal. Denne ejendom deles af hver af de mange gennemsnitstyper.

En anden universel egenskab er monotonicitet : Hvis to lister med tal A og B har samme længde, og hver post i liste A er mindst lige så stor som den tilsvarende post på liste B , er gennemsnittet af liste A mindst som for liste B . Alle gennemsnit opfylder også lineær homogenitet : hvis alle tal på en liste ganges med det samme positive tal, ændres dets gennemsnit med den samme faktor.

I nogle gennemsnitstyper tildeles elementerne på listen forskellige vægte, før gennemsnittet bestemmes. Disse omfatter det vægtede aritmetiske middel , det vægtede geometriske middel og den vægtede median . Også for nogle typer glidende gennemsnit afhænger en artikels vægt af dens placering på listen. De fleste gennemsnitstyper tilfredsstiller imidlertid permutations -følsomhed: alle emner tæller ens ved bestemmelse af deres gennemsnitlige værdi og deres positioner på listen er irrelevante; gennemsnittet af (1, 2, 3, 4, 6) er det samme som (3, 2, 6, 4, 1).

Pythagoras betyder

Det aritmetiske middel , det geometriske middel og det harmoniske middel er samlet kendt som det pythagoreiske middel .

Statistisk placering

Den tilstand , den medianen , og mid-range anvendes ofte som supplement til den gennemsnitlige skøn over centrale tendens i deskriptiv statistik . Disse kan alle ses som at minimere variationen på en eller anden måde; se Central tendens § Løsninger på variationsproblemer .

Sammenligning af almindelige gennemsnit af værdier {1, 2, 2, 3, 4, 7, 9}
Type Beskrivelse Eksempel Resultat
Aritmetisk middelværdi Summen af ​​værdier for et datasæt divideret med antal værdier: (1+2+2+3+4+7+9) / 7 4
Median Mellemværdi, der adskiller de større og mindre halvdele af et datasæt 1, 2, 2, 3 , 4, 7, 9 3
Mode Hyppigste værdi i et datasæt 1, 2 , 2 , 3, 4, 7, 9 2
Mellemklasse Det aritmetiske middelværdi for et sæts højeste og laveste værdier (1+9) / 2 5

Mode

Sammenligning af aritmetisk middelværdi , median og tilstand for to log-normale fordelinger med forskellig skævhed

Det nummer, der oftest forekommer på en liste, kaldes tilstanden. For eksempel er listens tilstand (1, 2, 2, 3, 3, 3, 4) 3. Det kan ske, at der er to eller flere tal, der forekommer lige ofte og oftere end noget andet tal. I dette tilfælde er der ingen aftalt definition af mode. Nogle forfattere siger, at de alle er tilstande, og nogle siger, at der ikke er nogen tilstand.

Median

Medianen er gruppens midterste nummer, når de rangeres i rækkefølge. (Hvis der er et lige antal tal, tages middelværdien af ​​de to midterste.)

For at finde medianen skal du således bestille listen i henhold til dens elementers størrelse og derefter gentagne gange fjerne parret, der består af de højeste og laveste værdier, indtil enten en eller to værdier er tilbage. Hvis præcis en værdi er tilbage, er det medianen; hvis to værdier, er medianen det aritmetiske middel af disse to. Denne metode tager listen 1, 7, 3, 13 og beordrer den til at læse 1, 3, 7, 13. Derefter fjernes 1 og 13 for at få listen 3, 7. Da der er to elementer i denne resterende liste, medianen er deres aritmetiske gennemsnit, (3 + 7)/2 = 5.

Mellemklasse

Mellemområdet er det aritmetiske middel for de højeste og laveste værdier for et sæt.

Oversigt over typer

Navn Ligning eller beskrivelse
Aritmetisk middelværdi
Median Den midterste værdi, der adskiller den højere halvdel fra den nederste halvdel af datasættet
Geometrisk median En rotation invariant forlængelse af medianen for punkter i R n
Mode Den hyppigste værdi i datasættet
Geometrisk middelværdi
Harmonisk middelværdi
Kvadratisk middelværdi
(eller RMS)
Kubisk middelværdi
Generaliseret middelværdi
Vægtet middelværdi
Afkortet middelværdi Det aritmetiske middelværdi for dataværdier efter et bestemt antal eller en andel af de højeste og laveste dataværdier er blevet kasseret
Mellemkvartil middelværdi Et specielt tilfælde af det afkortede middelværdi ved hjælp af interkvartilområdet . Et særligt tilfælde af det interkvantile afkortede middel, der opererer på kvantiler (ofte deciler eller percentiler), der er lige langt, men på modsatte sider af medianen.
Mellemklasse
Winsorized middelværdi Ligner det afkortede middelværdi, men i stedet for at slette de ekstreme værdier sættes de til de største og mindste værdier, der er tilbage

Den tabel over matematiske symboler forklarer de anvendte symboler følgende.

Diverse typer

Andre mere sofistikerede gennemsnit er: trimean , trimedian og normaliseret middel med deres generaliseringer.

Man kan oprette sin egen gennemsnitlige metrik ved hjælp af det generaliserede f -middel :

hvor f er en inverterbar funktion. Det harmoniske middel er et eksempel på dette ved hjælp af f ( x ) = 1/ x , og det geometriske middel er et andet ved hjælp af f ( x ) = log  x .

Denne metode til generering af midler er imidlertid ikke generel nok til at fange alle gennemsnit. En mere generel metode til at definere et gennemsnit tager enhver funktion g ( x 1x 2 , ...,  x n ) af en liste over argumenter, der er kontinuerlig , strengt stigende i hvert argument og symmetrisk (invariant under permutation af argumenterne ). Gennemsnittet y er derefter den værdi, der ved udskiftning af hvert medlem af listen resulterer i den samme funktionsværdi: g ( y , y , ..., y ) = g ( x 1 , x 2 , ..., x n ) . Denne mest generelle definition fanger stadig den vigtige egenskab ved alle gennemsnit, at gennemsnittet af en liste over identiske elementer er selve elementet. Funktionen g ( x 1 , x 2 , ..., x n ) = x 1 + x 2 + ··· + x n giver det aritmetiske middel. Funktionen g ( x 1 , x 2 , ..., x n ) = x 1 x 2 ··· x n (hvor listeelementerne er positive tal) giver det geometriske middel. Funktionen g ( x 1 , x 2 , ..., x n ) = - ( x 1 −1 + x 2 −1 + ··· + x n −1 ) (hvor listeelementerne er positive tal) giver harmonisk middel.

Gennemsnitlig procent afkast og CAGR

En type gennemsnit, der bruges i finansiering, er det gennemsnitlige procentvise afkast. Det er et eksempel på et geometrisk middel. Når afkastene er årlige, kaldes det Compound Annual Growth Rate (CAGR). For eksempel, hvis vi overvejer en periode på to år, og investeringsafkastet i det første år er −10% og afkastet i det andet år er +60%, så kan den gennemsnitlige procentvise afkast eller CAGR, R , opnås ved at løse ligningen: (1 - 10%) × (1 + 60%) = (1 - 0,1) × (1 + 0,6) = (1 + R ) × (1 + R ) . Værdien af R, der gør denne ligning sand, er 0,2 eller 20%. Det betyder, at det samlede afkast i løbet af 2-årsperioden er det samme, som hvis der havde været en vækst på 20% hvert år. Årenes rækkefølge gør ingen forskel - den gennemsnitlige procentvise afkast på +60% og −10% er det samme resultat som for −10% og +60%.

Denne metode kan generaliseres til eksempler, hvor perioderne ikke er ens. Overvej f.eks. En periode på et halvt år, for hvilket afkastet er −23% og en periode på to og et halvt år, for hvilket afkastet er +13%. Det gennemsnitlige procentvise afkast for den kombinerede periode er enkeltårets afkast, R , det er løsningen på følgende ligning: (1 - 0,23) 0,5 × (1 + 0,13) 2,5 = (1 + R ) 0,5 + 2,5 , hvilket giver en gennemsnitligt afkast R på 0,0600 eller 6,00%.

Glidende gennemsnit

I betragtning af en tidsserie , f.eks. Daglige aktiekurser eller årlige temperaturer, ønsker folk ofte at oprette en mere jævn serie. Dette hjælper med at vise underliggende tendenser eller måske periodisk adfærd. En let måde at gøre dette på er det glidende gennemsnit : man vælger et tal n og opretter en ny serie ved at tage det aritmetiske middelværdi for de første n -værdier, derefter gå et sted fremad ved at tabe den ældste værdi og indføre en ny værdi på den anden slutningen af ​​listen osv. Dette er den enkleste form for glidende gennemsnit. Mere komplicerede former involverer at bruge et vægtet gennemsnit . Vægtningen kan bruges til at forbedre eller undertrykke forskellige periodiske adfærd, og der er meget omfattende analyse af, hvilke vægtninger der skal bruges i litteraturen om filtrering . I digital signalbehandling bruges udtrykket "glidende gennemsnit", selvom vægten ikke er 1,0 (så output -serien er en skaleret version af gennemsnitsværdierne). Grunden til dette er, at analytikeren normalt kun er interesseret i tendensen eller den periodiske adfærd.

Historie

Oprindelse

Den første registrerede tid, hvor det aritmetiske middel blev forlænget fra 2 til n tilfælde for brug af estimering, var i det sekstende århundrede. Fra slutningen af ​​det sekstende århundrede og fremefter blev det gradvist en almindelig metode at bruge til at reducere målefejl på forskellige områder. På det tidspunkt ønskede astronomer at kende en reel værdi fra støjende måling, såsom en planets position eller månens diameter. Ved hjælp af middelværdien af ​​flere måleværdier antog forskere, at fejlene udgør et relativt lille antal sammenlignet med summen af ​​alle måleværdier. Metoden til at tage middelværdien til at reducere observationsfejl blev faktisk hovedsageligt udviklet inden for astronomi. En mulig forløber for det aritmetiske middel er mellemklassen (middelværdien af ​​de to ekstreme værdier), der f.eks. Bruges i arabisk astronomi i det niende til ellevte århundrede, men også i metallurgi og navigation.

Der er imidlertid forskellige ældre vage henvisninger til brugen af ​​det aritmetiske middel (som ikke er så klare, men rimeligt kan have at gøre med vores moderne definition af middelværdien). I en tekst fra det 4. århundrede blev der skrevet, at (tekst i firkantede parenteser mangler en mulig tekst, der kan tydeliggøre betydningen):

For det første skal vi i rækkefølge angive rækkefølgen af ​​tal fra monaden op til ni: 1, 2, 3, 4, 5, 6, 7, 8, 9. Derefter skal vi lægge mængden af ​​alle sammen af dem sammen, og da rækken indeholder ni udtryk, skal vi lede efter den niende del af totalen for at se, om den allerede naturligt er til stede blandt tallene i rækken; og vi vil opdage, at egenskaben ved at være [en] niende [af summen] kun tilhører [aritmetikken] middelværdien selv ...

Selv ældre potentielle referencer findes. Der er optegnelser om, at fra omkring 700 f.Kr. var købmænd og afsendere enige om, at skader på last og skib (deres "bidrag" i tilfælde af skader ved havet) skulle deles ligeligt mellem hinanden. Dette kan have været beregnet ved hjælp af gennemsnittet, selvom der tilsyneladende ikke er nogen direkte registrering af beregningen.

Etymologi

Roden findes på arabisk som عوار ʿawār , en defekt eller noget defekt eller beskadiget, herunder delvist ødelagt merchandise; og عواري ʿawārī (også عوارة ʿawāra ) = "af eller relateret til ʿawār , en tilstand af delvis skade". Inden for de vestlige sprog begynder ordets historie i middelalderlig havhandel ved Middelhavet. 12. og 13. århundrede Genova Latin avaria betød "skade, tab og ikke-normale udgifter, der opstår i forbindelse med en handelsskibsfart"; og den samme betydning for avaria er i Marseille i 1210, Barcelona i 1258 og Firenze i slutningen af ​​13. Fransk avarie fra 1400-tallet havde den samme betydning, og den fødte engelsk "averay" (1491) og engelsk "gennemsnit" (1502) med samme betydning. I dag har italiensk avaria , catalansk avaria og fransk avarie stadig den primære betydning af "skade". Den enorme transformation af betydningen på engelsk begyndte med praksis i senere middelalderlige og tidlige moderne vestlige handels- og handelslovkontrakter, hvorefter hvis skibet mødte en dårlig storm, og nogle af goderne skulle kastes over bord for at gøre skibet lettere og mere sikkert , da skulle alle købmænd, hvis gods var på skibet, lide proportionalt (og ikke den, hvis varer blev kastet over bord); og mere generelt skulle der være en forholdsmæssig fordeling af enhver avaria . Derfra blev ordet vedtaget af britiske forsikringsselskaber, kreditorer og købmænd for at tale om deres tab som spredt over hele deres portefølje af aktiver og have en gennemsnitlig andel. Dagens betydning udviklede sig ud af det og startede i midten af ​​1700-tallet og startede på engelsk. [1] .

Havskader er enten et bestemt gennemsnit , som kun bæres af ejeren af ​​den beskadigede ejendom, eller det generelle gennemsnit , hvor ejeren kan kræve et proportionelt bidrag fra alle parter i marinefirmaet. Den type beregninger, der blev brugt til at justere det generelle gennemsnit, gav anledning til brugen af ​​"gennemsnit" til at betyde "aritmetisk middelværdi".

En anden engelsk brug, dokumenteret allerede i 1674 og undertiden stavet "averish", er rester og anden vækst af markafgrøder, der blev anset for egnede til konsum af trækdyr ("avers").

Der er tidligere (fra mindst det 11. århundrede), uafhængig brug af ordet. Det ser ud til at være en gammel juridisk betegnelse for en lejers dagforpligtelse over for en lensmand, sandsynligvis angliciseret fra "avera" fundet i den engelske Domesday Book (1085).

Oxford English Dictionary siger imidlertid, at afledninger fra tysk hafen haven, og arabisk ʿawâr tab, skade, er blevet "helt bortskaffet", og ordet har en romansk oprindelse.

Gennemsnit som et retorisk værktøj

På grund af den førnævnte i daglig tale af udtrykket "gennemsnit" kan udtrykket bruges til at tilsløre den sande betydning af data og foreslå forskellige svar på spørgsmål baseret på den gennemsnitlige metode (oftest aritmetisk middel, median eller mode), der bruges. I sin artikel "Framed for Lying: Statistics as In/Artistic Proof" kommenterer fakultetsmedlem ved University of Pittsburgh Daniel Libertz, at statistiske oplysninger ofte afvises fra retoriske argumenter af denne grund. På grund af deres overtalelseskraft bør gennemsnit og andre statistiske værdier ikke kasseres fuldstændigt, men i stedet bruges og fortolkes med forsigtighed. Libertz inviterer os til kritisk ikke blot at engagere sig i statistiske oplysninger såsom gennemsnit, men også med det sprog, der bruges til at beskrive dataene og deres anvendelser, idet han siger: "Hvis statistik er afhængig af fortolkning, bør retorer invitere deres publikum til at fortolke frem for at insistere på en fortolkning. " I mange tilfælde leveres data og specifikke beregninger for at lette denne publikumsbaserede fortolkning.

Se også

Referencer

eksterne links