Invariant udvidet Kalman filter - Invariant extended Kalman filter

Den invariant udvidet Kalman-filter (IEKF) (ikke at forveksle med den gentog udvidet Kalman filter) blev først introduceret som en version af den udvidede Kalman-filteret (EKF) til ikke-lineære systemer besidder symmetrier (eller invariances ), derefter generaliseret og omarbejdning som en tilpasning til Lie-grupper i den lineære Kalman-filtreringsteori . I stedet for at bruge en lineær korrektionsperiode baseret på en lineær outputfejl bruger IEKF en geometrisk tilpasset korrektionsperiode baseret på en uændret outputfejl; på samme måde opdateres forstærkningsmatricen ikke fra en lineær tilstandsfejl, men fra en uforanderlig tilstandsfejl. Den største fordel er, at gevinst- og kovariansligningerne har reduceret afhængighed af statens estimerede værdi. I nogle tilfælde konvergerer de til konstante værdier på et meget større sæt baner, end det er tilfældet for EKF, hvilket resulterer i en bedre konvergens af estimeringen.

Filterafledning

Diskret tidsramme

Overvej et system, hvis tilstand er kodet til tidstrin af et element i en Lie-gruppe, og dynamikken har følgende form:

hvor er en gruppeautomisme af , er gruppens operation og et element af . Systemet formodes at blive observeret gennem en måling med følgende form:

hvor hører til et vektorrum udstyret med en venstre handling af elementerne betegnet igen med (som ikke kan skabe forvirring med gruppearbejdet, da det andet medlem af operationen er et element af , ikke ). Alternativt gælder den samme teori for en måling defineret af en rigtig handling :

Filtrer ligninger

Det uændrede udvidede Kalman-filter er en observatør defineret af følgende ligninger, hvis målefunktionen er en venstre handling:

hvor er det eksponentielle kort over og er en forstærkningsmatrix, der skal indstilles gennem en Riccati-ligning.

Hvis målefunktionen er en rigtig handling, defineres opdateringstilstanden som:

Løbende ramme

Ovenstående diskrete tidsramme blev først introduceret til kontinuerlig dynamik i formen:

hvor vektorfeltet til enhver tid verificerer forholdet:

hvor gruppens identitetselement er betegnet med og bruges korthåndsnotationen (hhv. ) til venstre oversættelse (hhv. den højre oversættelse ), hvor det angiver tangentrummet til at . Det fører til mere involverede beregninger end den diskrete tidsramme, men egenskaber er ens.

Vigtigste egenskaber

Den største fordel ved invariant-udvidet Kalman-filtrering er opførelsen af ​​den variabelfejlvariabel, hvis definition afhænger af målingstypen. For venstre handlinger definerer vi en venstrevariabel fejlvariabel som:

,
,

mens vi for rigtige handlinger definerer en variabel med højre invariant som:

,
,

Faktisk erstatter , , deres værdier, vi får til venstre handlinger, efter nogen algebra:

,
,

og for rigtige handlinger:

,
,

Vi ser, at den estimerede værdi af staten ikke er involveret i ligningen efterfulgt af fejlvariablen, en egenskab ved lineær Kalman-filtrering af det klassiske udvidede Kalman-filter deler ikke, men ligheden med det lineære tilfælde går faktisk meget længere. Lad være en lineær version af fejlvariablen defineret af identiteten:

Derefter, med defineret af Taylor-udvidelsen, har vi faktisk:

Med andre ord er der ingen begreber med højere ordre: dynamikken er lineær for fejlvariablen . Dette uafhængighed af resultat og fejldynamik er kernen i IEKF's teoretiske egenskaber og praktiske ydeevne.

Forhold til observatører, der bevarer symmetri

De fleste fysiske systemer har naturlige symmetrier (eller invarians), dvs. der findes transformationer (f.eks. Rotationer, oversættelser, skaleringer), der efterlader systemet uændret. Fra matematisk og teknisk synspunkt er det fornuftigt, at et filter, der er godt designet til det betragtede system, skal bevare de samme uforanderlige egenskaber. Ideen til IEKF er en modifikation af EKF-ligningerne for at drage fordel af systemets symmetrier.

Definition

Overvej systemet

hvor er uafhængige hvide gaussiske lyde . Overvej en Lie-gruppe med identitet og (lokale) transformationsgrupper ( ) sådan, at . Det tidligere system med støj siges at være uforanderligt, hvis det efterlades uændret af handlingen, som transformationerne grupperer ; det vil sige hvis

.

Filtrer ligninger og hovedresultat

Da det er et symmetri-bevarende filter , læser den generelle form for en IEKF

hvor

  • er en uændret outputfejl, som er forskellig fra den sædvanlige outputfejl
  • er en invariant ramme
  • er en invariant vektor
  • er en frit valgt forstærkningsmatrix.

For at analysere fejlkonvergensen defineres en uforanderlig tilstandsfejl , som er forskellig fra standardoutputfejlen , da standardoutputfejlen normalt ikke bevarer systemets symmetrier.

I betragtning af det betragtede system og den tilknyttede transformationsgruppe findes der en konstruktiv metode til at bestemme , baseret på metoden med bevægelig ramme.

På samme måde som EKF bestemmes forstærkningsmatricen ud fra ligningerne

,
,

hvor matricerne kun afhænger her af den kendte invariante vektor snarere end af som i standard EKF. Denne meget enklere afhængighed og dens konsekvenser er IEKFs hovedinteresser. Faktisk er matricerne konstant på et meget større sæt af baner (såkaldte permanente baner ) end ligevægtspunkter, som det er tilfældet for EKF. I nærheden af ​​sådanne baner er vi tilbage til det "sande", dvs. lineære Kalman-filter, hvor konvergens er garanteret. Uformelt betyder det, at IEKF generelt konvergerer i det mindste omkring enhver langsomt varierende permanent bane snarere end bare omkring ethvert langsomt varierende ligevægtspunkt for EKF.

Eksempler på anvendelse

Attitude- og kursreferencesystemer

Invariant udvidede Kalman-filtre bruges for eksempel i attitude- og kursreferencesystemer . I sådanne systemer estimeres orientering, hastighed og / eller position for et bevægeligt stift legeme, f.eks. Et fly, ud fra forskellige indlejrede sensorer, såsom inerti-sensorer, magnetometre, GPS eller ekkolod. Brugen af en IEKF naturligt fører til at overveje quaternionen fejl , der ofte bruges som en ad hoc- trick for at bevare de begrænsninger af quaternionen gruppe. Fordelene ved IEKF sammenlignet med EKF vises eksperimentelt for et stort sæt baner.

Træningsnavigation

En vigtig anvendelse af Invariant-udvidet Kalman-filter er inertial navigation , som passer til rammen efter indlejring af tilstanden (bestående af holdningsmatrix , hastighedsvektor og positionsvektor ) i Lie-gruppen defineret af gruppedriften:

Samtidig lokalisering og kortlægning

Problemet med samtidig lokalisering og kortlægning passer også til rammerne for invariant udvidet Kalman-filtrering efter indlejring af staten (bestående af holdningsmatrix , positionsvektor og en sekvens af statiske modningspunkter ) i Lie-gruppen (eller for plane systemer) defineret af gruppedrift:

Den største fordel ved Invariant-udvidede Kalman-filter i dette tilfælde er at løse problemet med falsk observerbarhed.

Referencer

  1. ^ Bonnabel, S. (2007, december). Venstre-invariant udvidet Kalman-filter og holdningsestimering. I 2007 46. IEEE-konference om beslutning og kontrol (s. 1027-1032). IEEE.
  2. ^ a b c d Barrau, A., & Bonnabel, S. (2016). Den uforanderlige udvidede Kalman-filteret som en stabil observatør. IEEE-transaktioner ved automatisk kontrol, 62 (4), 1797-1812.
  3. ^ Barrau, A., & Bonnabel, S. (2019). Lineære observerede systemer på grupper. Systems & Control Letters, 129, 36-42.
  4. ^ S. Bonnabel, Ph. Martin og P. Rouchon, "Symmetry-preservering observators," IEEE Transactions on Automatic and Control , vol. 53, nr. 11, s. 2514-2526, 2008.
  5. ^ a b S. Bonnabel, Ph. Martin og E. Salaün, "Invariant Extended Kalman Filter: theory and application to a velocity-aided attitude estimation problem", 48. IEEE Conference on Decision and Control, s. 1297–1304, 2009.
  6. ^ Ph. Martin og E. Salaün, "Generaliseret multiplikativt udvidet Kalman-filter til Aided Attitude og Heading Reference System", AIAA Guidance, Navigation and Control Conference, 2010
  7. ^ a b c Barrau, A., & Bonnabel, S. (2015). En EKF-SLAM-algoritme med konsistensegenskaber. arXiv fortryk arXiv: 1510.06263.