Vægtning for omvendt varians - Inverse-variance weighting

I statistik er inverse variansvægtning en metode til at samle to eller flere tilfældige variabler for at minimere variansen af det vægtede gennemsnit. Hver tilfældig variabel vægtes i omvendt forhold til dens varians, dvs. proportional med dens præcision .

Givet en sekvens af uafhængige observationer y i med afvigelser σ i 2 , er det indvendige variansvægtede gennemsnit givet ved

Det omvendte variansvægtede gennemsnit har den mindste varians blandt alle vejede gennemsnit, som kan beregnes som

Hvis målingernes afvigelser er ens, bliver det vægtede gennemsnit af det inverse varians det enkle gennemsnit.

Vægtning af invers varians anvendes typisk i statistisk metaanalyse eller sensorfusion for at kombinere resultaterne fra uafhængige målinger.

Sammenhæng

Antag at en eksperimentator vil måle værdien af ​​en mængde, siger accelerationen på grund af jordens tyngdekraft , hvis sande værdi tilfældigvis er . En omhyggelig eksperimentator foretager flere målinger, som vi betegner med tilfældige variabler . Hvis de alle er støjende, men upartiske, dvs. måleenheden ikke systematisk overvurderer eller undervurderer den sande værdi, og fejlene spredes symmetrisk, så forventningsværdien . Spredningen i målingen er derefter karakteriseret ved variansen af de tilfældige variabler , og hvis målingerne udføres under identiske scenarier, så er alle de samme, som vi skal henvise til ved . Givet målingerne er en typisk estimator for , betegnet som , givet ved det enkle gennemsnit . Bemærk, at dette empiriske gennemsnit også er en tilfældig variabel, hvis forventningsværdi er, men også har en spredning. Hvis de enkelte målinger ikke er korreleret, gives kvadratet af fejlen i estimatet af . Derfor, hvis alle er ens, falder fejlen i estimatet med stigning i som , hvilket gør flere observationer foretrukne.

I stedet for gentagne målinger med et instrument, hvis eksperimentatoren foretager den samme mængde med forskellige instrumenter med varierende kvalitet af målingerne, er der ingen grund til at forvente, at de forskellige er de samme. Nogle instrumenter kunne være mere støjende end andre. I eksemplet med måling af accelerationen på grund af tyngdekraften kunne de forskellige "instrumenter" måle fra et simpelt pendul , fra analyse af en projektilbevægelse osv. Det enkle gennemsnit er ikke længere en optimal estimator, da fejlen i faktisk kan overstige fejlen i mindst støjende måling, hvis forskellige målinger har meget forskellige fejl. I stedet for at kassere de støjende målinger, der øger den endelige fejl, kan eksperimentatoren kombinere alle målingerne med passende vægte for at give mere vægt på de mindst støjende målinger og omvendt. I betragtning af kendskabet til , ville en optimal estimator til måling være et vægtet gennemsnit af målingerne for det specifikke valg af vægte . Estimatorens varians , som for det optimale valg af vægte bliver

Bemærk, at siden estimatoren har en spredning, der er mindre end spredningen i enhver individuel måling. Desuden falder spredningen ind med tilføjelse af flere målinger, men de mere støjende målinger kan være.

Afledning

Overvej en generisk vægtet sum , hvor vægtene normaliseres således, at . Hvis alle er uafhængige, variansen af er givet ved

For optimalitet ønsker vi at minimere, hvad der kan gøres ved at sidestille gradienten med hensyn til vægten til nul, mens vi opretholder begrænsningen . Ved hjælp af en Lagrange-multiplikator til at håndhæve begrænsningen udtrykker vi variansen

For ,

hvilket indebærer det

Den vigtigste takeaway her er det . Siden ,

De individuelle normaliserede vægte er

Det er let at se, at denne ekstreme løsning svarer til minimumet fra den anden partielle afledte test ved at bemærke, at variansen er en kvadratisk funktion af vægtene. Således angives estimatorens mindste varians ved

Normale fordelinger

For normalt distribuerede tilfældige variabler kan inverse-variansvægtede gennemsnit også udledes som det maksimale sandsynlighedsestimat for den sande værdi. Ud fra et Bayesisk perspektiv er den bageste fordeling for den sande værdi givet normalt distribuerede observationer og en flad prior en normalfordeling med det inverse-variansvægtede gennemsnit som middel og varians.

Multivariat sag

For multivariate distributioner fører et ækvivalent argument til en optimal vægtning baseret på kovariansmatricerne i de enkelte estimater :

For multivariate distributioner anvendes udtrykket "præcisionsvægtet" gennemsnit mere.

Se også

Referencer