Uscented transform - Unscented transform

Den uparfinerede transformation (UT) er en matematisk funktion, der bruges til at estimere resultatet af at anvende en given ikke-lineær transformation på en sandsynlighedsfordeling, der kun er karakteriseret i form af et endeligt sæt statistikker. Den mest almindelige anvendelse af den ikke-duftede transformation er i den ikke-lineære projektion af middel- og kovariansestimater i sammenhæng med ikke-lineære udvidelser af Kalman-filteret . Dens skaber Jeffrey Uhlmann forklarede, at "uparfumeret" var et vilkårligt navn, som han antog for at undgå, at det blev omtalt som "Uhlmann-filteret."

Baggrund

Mange filtrerings- og kontrolmetoder repræsenterer estimater for et systems tilstand i form af en middelvektor og en tilknyttet fejlkovariansmatrix. Som et eksempel kan den estimerede 2-dimensionelle position for et objekt af interesse være repræsenteret af en gennemsnitlig positionsvektor med en usikkerhed givet i form af en 2x2 kovariansmatrix, der giver variansen i , variansen i og krydskovariansen mellem de to. En kovarians, der er nul, indebærer, at der ikke er nogen usikkerhed eller fejl, og at objektets position er præcis, hvad der er specificeret af middelvektoren.

Middel- og kovariansrepræsentationen giver kun de første to øjeblikke af en underliggende, men ellers ukendt, sandsynlighedsfordeling. I tilfælde af et objekt i bevægelse kan den ukendte sandsynlighedsfordeling repræsentere usikkerheden om objektets position på et givet tidspunkt. Middel- og kovariansrepræsentationen af ​​usikkerhed er matematisk praktisk, fordi enhver lineær transformation kan anvendes til en middelvektor og kovariansmatrix som og . Denne linearitetsegenskab holder ikke øjeblikke ud over det første rå øjeblik (middelværdien) og det andet centrale øjeblik (kovariansen), så det er generelt ikke muligt at bestemme middelværdien og kovariansen som følge af en ikke-lineær transformation, fordi resultatet afhænger af alle øjeblikke, og kun de to første er givet.

Selvom kovariansmatrixen ofte behandles som værende den forventede kvadratiske fejl forbundet med middelværdien, opretholdes matrixen i praksis som en øvre grænse for den faktiske kvadratiske fejl. Specifikt opretholdes et middel- og kovariansestimat konservativt, så kovariansmatricen er større end eller lig med den faktiske kvadratiske fejl forbundet med . Matematisk betyder dette, at resultatet af at fratrække den forventede kvadratiske fejl (som normalt ikke er kendt) fra er en semi-bestemt eller positiv-bestemt matrix . Årsagen til at opretholde et konservativt kovariansestimat er, at de fleste filtrerings- og kontrolalgoritmer vil have en tendens til at afvige (mislykkes), hvis kovariansen undervurderes. Dette skyldes, at en falsk lille kovarians indebærer mindre usikkerhed og fører til, at filteret lægger mere vægt (tillid), end det er berettiget i gennemsnitets nøjagtighed.

Når vi vender tilbage til eksemplet ovenfor, når kovariansen er nul, er det trivielt at bestemme placeringen af ​​objektet, efter at det bevæger sig i henhold til en vilkårlig ikke-lineær funktion : anvend kun funktionen på middelvektoren. Når kovariansen ikke er nul, vil det transformerede gennemsnit generelt ikke være lig med, og det er ikke engang muligt at bestemme gennemsnittet af den transformerede sandsynlighedsfordeling ud fra kun dets tidligere gennemsnit og kovarians. I betragtning af denne ubestemmelighed kan det ikke-lineært transformerede gennemsnit og kovarians kun tilnærmes. Den tidligste tilnærmelse var at linearisere den ikke-lineære funktion og anvende den resulterende Jacobianske matrix til det givne gennemsnit og kovarians. Dette er grundlaget for det udvidede Kalman-filter (EKF), og selvom det vides at give dårlige resultater under mange omstændigheder, var der intet praktisk alternativ i mange årtier.

Motivation for den uparfumerede transformation

I 1994 bemærkede Jeffrey Uhlmann , at EKF tager en ikke-lineær funktion og delvis distributionsinformation (i form af et gennemsnit og et kovariansestimat) af et systems tilstand, men anvender en tilnærmelse til den kendte funktion snarere end til den upræcist kendte sandsynlighedsfordeling. . Han foreslog, at en bedre tilgang ville være at bruge den nøjagtige ikke-lineære funktion anvendt på en tilnærmelsesvis sandsynlighedsfordeling. Motivationen for denne tilgang gives i hans doktorafhandling, hvor udtrykket uparfumeret transformation først blev defineret:

Overvej følgende intuition: Med et fast antal parametre bør det være lettere at tilnærme en given fordeling end det er at tilnærme en vilkårlig ikke-lineær funktion / transformation . Efter denne intuition er målet at finde en parametrering, der fanger middel- og kovariansinformation, samtidig med at den tillader direkte udbredelse af informationen gennem et vilkårligt sæt ikke-lineære ligninger. Dette kan opnås ved at generere en diskret fordeling med de samme første og andet (og muligvis højere) øjeblikke, hvor hvert punkt i den diskrete tilnærmelse kan transformeres direkte. Gennemsnittet og kovariansen af ​​det transformerede ensemble kan derefter beregnes som estimatet for den ikke-lineære transformation af den oprindelige distribution. Mere generelt betegnes anvendelsen af ​​en given ikke-lineær transformation til en diskret fordeling af punkter, beregnet for at fange et sæt kendte statistikker for en ukendt distribution, som en uparfumeret transformation .

Med andre ord kan den givne middelværdi og kovariansinformation kodes nøjagtigt i et sæt punkter, kaldet sigma-punkter , som, hvis de behandles som elementer i en diskret sandsynlighedsfordeling, har gennemsnit og kovarians lig med det givne gennemsnit og kovarians. Denne fordeling kan formeres nøjagtigt ved at anvende den ikke-lineære funktion til hvert punkt. Middelværdien og kovariansen af ​​det transformerede sæt af punkter repræsenterer derefter det ønskede transformerede estimat. Den største fordel ved fremgangsmåden er, at den ikke-lineære funktion udnyttes fuldt ud i modsætning til EKF, der erstatter den med en lineær. Fjernelse af behovet for linearisering giver også fordele uafhængigt af enhver forbedring af estimeringskvaliteten. En øjeblikkelig fordel er, at UT kan anvendes med en hvilken som helst given funktion, mens linearisering muligvis ikke er mulig for funktioner, der ikke kan differentieres. En praktisk fordel er, at UT kan være lettere at implementere, fordi det undgår behovet for at udlede og implementere en lineær Jacobians matrix.

Sigma peger

For at beregne den uparfaminerede transformation skal man først vælge et sæt sigma-punkter. Siden Uhlmanns skelsættende arbejde er der foreslået mange forskellige sæt sigmapunkter i litteraturen. En grundig gennemgang af disse varianter findes i Menegaz et. al. Generelt er sigmapunkter nødvendige og tilstrækkelige til at definere en diskret fordeling med et givet gennemsnit og en kovarians i dimensioner.

Et kanonisk sæt sigmapunkter er det symmetriske sæt oprindeligt foreslået af Uhlmann. Overvej følgende simpleks af punkter i to dimensioner:

Det kan verificeres, at ovenstående sæt af punkter har gennemsnit og kovarians (identitetsmatrixen). Givet ethvert 2-dimensionelt gennemsnit og kovarians, kan de ønskede sigma-punkter opnås ved at multiplicere hvert punkt med matrix kvadratroden af og tilføje . Et lignende kanonisk sæt sigmapunkter kan genereres i et vilkårligt antal dimensioner ved at tage nulvektoren og de punkter, der omfatter rækkerne i identitetsmatrixen, beregne gennemsnittet af sæt af punkter, trække middelværdien fra hvert punkt, så den resulterende sæt har et gennemsnit på nul, og derefter beregner kovariansen af ​​nul-middelværdien af ​​punkter og anvender dets inverse på hvert punkt, så sætets kovarians er lig identiteten.

Uhlmann viste, at det er nemt at generere et symmetrisk sæt sigmapunkter fra kolonnerne på og nulvektoren, hvor er den givne kovariansmatrix uden at skulle beregne en matrix invers. Det er beregningseffektivt, og fordi punkterne danner en symmetrisk fordeling, fanger det tredje centrale øjeblik (skævheden), når den underliggende fordeling af statens estimat er kendt eller kan antages at være symmetrisk. Han viste også, at vægte, inklusive negative vægte, kan bruges til at påvirke sætets statistik. Julier udviklede og undersøgte også teknikker til generering af sigmapunkter for at fange det tredje øjeblik (skævheden) af en vilkårlig fordeling og det fjerde øjeblik (kurtosen) af en symmetrisk fordeling.

Eksempel

Den ikke-duftende transformation er defineret til anvendelse af en given funktion til enhver delvis karakterisering af en ellers ukendt fordeling, men dens mest almindelige anvendelse er for det tilfælde, hvor kun middelværdien og kovariansen er angivet. Et almindeligt eksempel er konvertering fra et koordinatsystem til et andet, såsom fra en kartesisk koordinatramme til polære koordinater.

Antag, at et 2-dimensionelt gennemsnit og kovariansestimat er angivet i kartesiske koordinater med:

og transformationsfunktionen til polære koordinater , er:

Multiplikation af hvert af de kanoniske simplex sigma-punkter (givet ovenfor) ved at tilføje middelværdien , giver:

Anvendelse af transformationsfunktionen til hvert af ovenstående punkter giver:

Gennemsnittet af disse tre transformerede punkter er UT-estimatet af middelværdien i polære koordinater:

UT-estimatet for kovariansen er:

hvor hvert kvadratudtryk i summen er et vektor ydre produkt. Dette giver:

Dette kan sammenlignes med det lineariserede gennemsnit og kovarians:

Den absolutte forskel mellem UT og lineariserede estimater er i dette tilfælde relativt lille, men i filtreringsapplikationer kan den kumulative effekt af små fejl føre til uoprettelig afvigelse af estimatet. Effekten af ​​fejlene forværres, når kovariansen undervurderes, fordi dette får filteret til at være for selvsikker i nøjagtigheden af ​​middelværdien. I ovenstående eksempel kan det ses, at det lineariserede kovariansestimat er mindre end UT-estimatet, hvilket antyder, at linearisering sandsynligvis har frembragt en undervurdering af den faktiske fejl i dets gennemsnit.

I dette eksempel er der ingen måde at bestemme den absolutte nøjagtighed af UT og lineariserede estimater uden jordens sandhed i form af den faktiske sandsynlighedsfordeling forbundet med det oprindelige estimat og middel og kovarians af denne fordeling efter anvendelse af den ikke-lineære transformation (f.eks. , som bestemt analytisk eller gennem numerisk integration). Sådanne analyser er blevet udført for koordinatransformationer under antagelse af Gaussianity for de underliggende distributioner, og UT-estimaterne har tendens til at være signifikant mere nøjagtige end dem, der opnås ved linearisering.

Empirisk analyse har vist, at brugen af ​​det minimale simpleksæt af sigmapunkter er signifikant mindre nøjagtig end brugen af ​​det symmetriske sæt af punkter, når den underliggende fordeling er gaussisk. Dette antyder, at brugen af ​​simpleksættet i ovenstående eksempel ikke ville være det bedste valg, hvis den underliggende fordeling, der er forbundet med, er symmetrisk. Selvom den underliggende fordeling ikke er symmetrisk, er simpleksættet sandsynligvis stadig mindre nøjagtigt end det symmetriske sæt, fordi asymmetrien for simpleksættet ikke matches med asymmetrien for den faktiske fordeling.

Når vi vender tilbage til eksemplet, kan det minimale symmetriske sæt sigmapunkter opnås fra kovariansmatrixen simpelthen som middelvektoren plus og minus kolonnerne i :

Denne konstruktion garanterer, at middelværdien og kovariansen af ​​de ovennævnte fire sigmapunkter er , hvilket er direkte kontrollerbart. Anvendelse af den ikke-lineære funktion på hvert af sigma-punkterne giver:

Gennemsnittet af disse fire transformerede sigmapunkter , er UT-estimatet af middelværdien i polære koordinater:

UT-estimatet for kovariansen er:

hvor det hver kvadrerede udtryk i summen er et ydre produktvektor. Dette giver:

Forskellen mellem UT og lineariserede middelestimater giver et mål for effekten af ​​transformationens ikke-linearitet. Når transformationen for eksempel er lineær, vil UT- og lineariserede estimater være identiske. Dette motiverer brugen af ​​kvadratet af denne forskel, der skal føjes til UT-kovariansen for at beskytte mod at undervurdere den faktiske fejl i middelværdien. Denne tilgang forbedrer ikke nøjagtigheden af ​​gennemsnittet, men kan forbedre nøjagtigheden af ​​et filter over tid væsentligt ved at reducere sandsynligheden for, at kovariansen er undervurderet.

Optimaliteten af ​​den uparfumerede transformation

Uhlmann bemærkede, at kun givet gennemsnittet og kovariansen af ​​en ellers ukendt sandsynlighedsfordeling, er transformationsproblemet dårligt defineret, fordi der er et uendeligt antal mulige underliggende fordelinger med de samme første to øjeblikke. Uden nogen a priori information eller antagelser om karakteristika for den underliggende distribution er ethvert valg af distribution, der bruges til at beregne det transformerede gennemsnit og kovarians, lige så rimeligt som ethvert andet. Med andre ord er der intet valg af fordeling med et givet middel og kovarians, der er bedre end det, der tilvejebringes af sættet af sigma-punkter, derfor er den uparfaminerede transformation trivielt optimal.

Denne generelle erklæring om optimalitet er naturligvis ubrugelig til at afgive kvantitative udsagn om UT's ydeevne, f.eks. Sammenlignet med linearisering; derfor har han, Julier og andre udført analyser under forskellige antagelser om egenskaberne ved fordelingen og / eller formen for den ikke-lineære transformationsfunktion. For eksempel, hvis funktionen er differentierbar, hvilket er vigtigt for linearisering, validerer disse analyser den forventede og empirisk bekræftede overlegenhed af den uparfaminerede transformation.

Ansøgninger

Den uparfaminerede transformation kan bruges til at udvikle en ikke-lineær generalisering af Kalman-filteret, kendt som Unscented Kalman Filter (UKF) . Dette filter har i vid udstrækning erstattet EKF i mange ikke-lineære filtrerings- og kontrolapplikationer, herunder til undervands-, jord- og luftfart og rumfartøjer. Den uparfaminerede transformation er også blevet brugt som en beregningsramme for optimal kontrol af Riemann-Stieltjes. Denne beregningsmetode er kendt som uparfumeret optimal kontrol .

Usorteret Kalman-filter

Uhlmann og Simon Julier offentliggjorde flere papirer, der viste, at brugen af ​​den uparfaminerede transformation i et Kalman-filter , der kaldes det uparfumerede Kalman-filter (UKF), giver betydelige præstationsforbedringer i forhold til EKF i en række applikationer. Julier og Uhlmann offentliggjorde papirer ved hjælp af en bestemt parametreret form for den uparfaminerede transformation i forbindelse med UKF, som brugte negative vægte til at indfange antaget distributionsinformation. Denne form for UT er modtagelig for en række numeriske fejl, som de originale formuleringer (det symmetriske sæt oprindeligt foreslået af Uhlmann) ikke lider. Julier har efterfølgende beskrevet parametriserede former, der ikke bruger negative vægte og heller ikke er underlagt disse problemer.

Se også

Referencer