Generaliseret filtrering - Generalized filtering

Generaliseret filtrering er et generisk Bayesisk filtreringsskema for ikke-lineære statsrumsmodeller. Det er baseret på et variabelt princip om mindste handling formuleret i generelle koordinater. Bemærk, at begrebet "generaliserede koordinater" som anvendt her adskiller sig fra begrebet generaliserede koordinater af bevægelse, som det anvendes i (multikropps) dynamisk systemanalyse. Generaliseret filtrering tilvejebringer bageste tætheder over skjulte tilstande (og parametre), der genererer observerede data ved hjælp af en generaliseret gradientnedstigning på variationerfri energi under Laplace-antagelsen . I modsætning til klassisk (f.eks. Kalman-Bucy eller partikelfiltrering ) undgår generaliseret filtrering markoviske antagelser om tilfældige udsving. Desuden fungerer det online og assimilerer data for at tilnærme den bageste tæthed over ukendte mængder uden behov for et bagudgående pass. Særlige tilfælde inkluderer variationfiltrering , maksimering af dynamisk forventning og generaliseret forudsigelig kodning .

Definition

Definition : Generaliseret filtrering hviler på tuplen :

  • Et prøveområde, hvorfra tilfældige udsving trækkes
  • Kontroltilstande - der fungerer som eksterne årsager, input eller tvangsbetingelser
  • Skjulte tilstande - der forårsager sensoriske tilstande og afhænger af kontroltilstande
  • Sensortilstande - en sandsynlig kortlægning fra skjulte og kontroltilstande
  • Generativ tæthed - over sensoriske, skjulte og kontroltilstande under en generativ model
  • Variationstæthed - over skjulte og kontroltilstande med gennemsnit


Her ~ betegner en variabel i generelle bevægelseskoordinater:

Generaliseret filtrering

Målet er at tilnærme den bageste tæthed over skjulte og kontroltilstande, givet sensortilstande og en generativ model - og estimere (path integral of) modelbevis for at sammenligne forskellige modeller. Dette involverer generelt en uigennemtrængelig marginalisering over skjulte tilstande, så modelbeviser (eller marginal sandsynlighed) erstattes med en variabel fri energi bundet. Givet følgende definitioner:

Betegn Shannon-entropien af densiteten ved . Vi kan derefter skrive den variationelle frie energi på to måder:

Den anden ligestilling viser, at minimering af variationsfri energi (i) minimerer Kullback-Leibler-divergensen mellem den variationelle og ægte posterior densitet og (ii) gengiver den variationelle frie energi (en bundet tilnærmelse til) det negative logbevis (fordi divergensen aldrig være mindre end nul). Under antagelsen fra Laplace er variationstætheden gaussisk, og den præcision, der minimerer fri energi, er . Dette betyder, at fri energi kan udtrykkes i form af det variationelle gennemsnit (udeladelse af konstanter):

De variationelle midler, der minimerer (stiintegral) af fri energi, kan nu gendannes ved at løse det generaliserede filter:

hvor er en blokmatrixderivatoperatør af identificerende matricer således, at

Variationsgrundlag

Generaliseret filtrering er baseret på følgende lemma: Den selvkonsistente løsning til at tilfredsstille det variationelle princip for stationær handling , hvor handling er stienintegret for den variationelle frie energi

Bevis : selvkonsistens kræver, at bevægelsen af ​​middelværdien er middelværdien af ​​bevægelsen og (ved det grundlæggende lemma for variationskalkulation )

Enkelt sagt ændrer små forstyrrelser på middelets sti ikke variationerfri energi, og den har den mindste virkning af alle mulige (lokale) stier.

Bemærkninger : Heuristisk udfører generaliseret filtrering en gradientnedstigning på variationerfri energi i en bevægende referenceramme:, hvor selve rammen minimerer variationerfri energi. For et beslægtet eksempel i statistisk fysik, se Kerr og Graham, der bruger ensembledynamik i generelle koordinater til at give en generaliseret fase-rumversion af Langevin og tilhørende Fokker-Planck-ligninger.

I praksis bruger generaliseret filtrering lokal linearisering over intervaller for at gendanne diskrete opdateringer

Dette opdaterer midlerne til skjulte variabler ved hvert interval (normalt intervallet mellem observationer).

Generative (state-space) modeller i generelle koordinater

Normalt er den generative tæthed eller model specificeret som en ikke-lineær input-state-output-model med kontinuerlige ikke-lineære funktioner:

Den tilsvarende generaliserede model (under lokale lineære antagelser) opnår fra kædereglen

Gaussiske antagelser om tilfældige udsving foreskriver derefter sandsynligheden og den empiriske prior for bevægelsen af ​​skjulte stater

Kovarianterne faktoriseres til en kovarians blandt variabler og korrelationer mellem generaliserede udsving, der koder for deres autokorrelation :

Her vurderes det andet derivat af autokorrelationsfunktionen til nul. Dette er et allestedsnærværende mål for ruhed i teorien om stokastiske processer . Afgørende er, at præcisionen (invers varians) af højordensderivater falder til nul ret hurtigt, hvilket betyder, at det kun er nødvendigt at modellere relativt lav ordens generaliseret bevægelse (normalt mellem to og otte) for en given eller parametreret autokorrelationsfunktion.

Særlige tilfælde

Filtrering af diskrete tidsserier

Når tidsserier observeres som en diskret rækkefølge af observationer, behandles den implicitte prøveudtagning som en del af den generative proces, hvor (ved hjælp af Taylors sætning )

I princippet kunne hele sekvensen bruges til at estimere skjulte variabler på hvert tidspunkt. Præcisionen af ​​prøver i fortiden og fremtiden falder dog hurtigt og kan ignoreres. Dette giver ordningen mulighed for at assimilere data online ved hjælp af lokale observationer omkring hvert tidspunkt (typisk mellem to og otte).

Generelle filtrerings- og modelparametre

For alle langsomt varierende modelparametre for ligningerne af bevægelse eller præcision tager generaliseret filtrering følgende form (hvor svarer til parametrets variationelle gennemsnit)

Her minimerer løsningen variabel fri energi, når bevægelsen af ​​middelværdien er lille. Dette kan ses ved at bemærke . Det er ligetil at vise, at denne løsning svarer til en klassisk Newton-opdatering .

Forholdet til Bayesian-filtrering og forudsigelig kodning

Generaliseret filtrering og Kalman-filtrering

Klassisk filtrering under antagelser fra Markovian eller Wiener svarer til at antage, at nøjagtigheden af ​​bevægelsen af ​​tilfældige udsving er nul. I dette begrænsende tilfælde skal man kun overveje staterne og deres første afledte . Dette betyder, at generaliseret filtrering har form af et Kalman-Bucy-filter med forudsigelses- og korrektionsbetingelser:

Udskiftning af denne første ordens filtrering i den diskrete opdateringsplan ovenfor giver svaret til (udvidet) Kalman-filtrering.

Generaliseret filtrering og partikelfiltrering

Partikelfiltrering er et stikprøvebaseret skema, der lindrer antagelser om formen for den variationelle eller omtrentlige bageste tæthed. Den tilsvarende generaliserede filtreringsplan kaldes variationsfiltrering . I variationsfiltrering diffunderer et ensemble af partikler over det frie energilandskab i en referenceramme, der bevæger sig med ensemblets forventede (generaliserede) bevægelse. Dette giver en relativt enkel ordning, der undgår gaussiske (unimodale) antagelser. I modsætning til partikelfiltrering kræver det ikke forslagstætheder - eller eliminering eller oprettelse af partikler.

Generaliseret filtrering og variation Bayes

Variations Bayes hviler på en gennemsnitlig feltopdeling af variationstætheden:

Denne partition inducerer en variation af opdateringer eller trin for hver marginal tæthed - der løses normalt analytisk ved hjælp af konjugatprioriteter. I generaliseret filtrering fører dette til dynamisk forventningsmaksimering . der omfatter et D-trin, der optimerer tilstrækkelig statistik over ukendte tilstande, et E-trin til parametre og et M-trin til præcisioner.

Generaliseret filtrering og forudsigelig kodning

Generel filtrering bruges normalt til at invertere hierarkiske modeller af følgende form

Den efterfølgende generaliserede gradientnedstigning på fri energi kan derefter udtrykkes kompakt i form af forudsigelsesfejl, hvor (udeladelse af ordrer med høj ordre):

Her er præcisionen af ​​tilfældige udsving på i- niveau. Dette er kendt som generaliseret prædiktiv kodning [11] med lineær forudsigelig kodning som et specielt tilfælde.

Ansøgninger

Generel filtrering er primært blevet anvendt på biologiske tidsserier - især funktionel magnetisk resonansbilleddannelse og elektrofysiologiske data. Dette er normalt i sammenhæng med dynamisk kausal modellering for at drage slutninger om de underliggende arkitekturer af (neuronale) systemer, der genererer data. Det bruges også til at simulere slutning med hensyn til generaliseret (hierarkisk) forudsigelig kodning i hjernen.

Se også

Referencer

eksterne links