Lineær – kvadratisk – gaussisk kontrol - Linear–quadratic–Gaussian control

I kontrolteorien er det lineære -kvadratiske -gaussiske ( LQG ) kontrolproblem et af de mest grundlæggende optimale kontrolproblemer . Det vedrører lineære systemer drevet af additiv hvid Gaussisk støj . Problemet er at bestemme en outputfeedback -lov, der er optimal i den forstand at minimere den forventede værdi af et kvadratisk omkostningskriterium . Outputmålinger antages at være ødelagt af gaussisk støj, og den oprindelige tilstand antages ligeledes at være en gaussisk tilfældig vektor.

Under disse forudsætninger kan en optimal kontrolordning inden for klassen af ​​lineære kontrollove udledes af et argument om færdiggørelse af kvadrater. Denne kontrollov, der er kendt som LQG -controlleren, er unik, og den er simpelthen en kombination af et Kalman -filter (en lineær – kvadratisk tilstandsestimator (LQE)) sammen med en lineær – kvadratisk regulator (LQR). De vigtigste adskillelse hedder det, at tilstandsestimator og tilstandstilbagekobling kan udformes uafhængigt af hinanden. LQG-kontrol gælder for både lineære tidsinvariante systemer såvel som lineære tidsvarierende systemer og udgør en lineær dynamisk feedbackkontrollov, der let kan beregnes og implementeres: LQG-controlleren selv er et dynamisk system som det system, den kontrollerer. Begge systemer har den samme tilstandsdimension.

En dybere erklæring om separationsprincippet er, at LQG -controlleren stadig er optimal i en bredere klasse af muligvis ikke -lineære controllere. Det vil sige, at anvendelse af en ikke -lineær kontrolordning ikke vil forbedre den forventede værdi af omkostningsfunktionen. Denne version af adskillelsesprincippet er et særligt tilfælde af adskillelsesprincippet for stokastisk kontrol, der siger, at selv når proces- og outputstøjkilder muligvis er ikke-gaussiske martingaler , så længe systemdynamikken er lineær, adskilles den optimale kontrol til en optimal tilstandsestimator (som muligvis ikke længere er et Kalman -filter) og en LQR -regulator.

I den klassiske LQG-indstilling kan implementering af LQG-controlleren være problematisk, når dimensionen af ​​systemtilstanden er stor. Den LQG problem reduceret ordre (fast-order LQG problem) overvinder dette ved at fastgøre et priori antallet af tilstande i LQG controller. Dette problem er vanskeligere at løse, fordi det ikke længere kan adskilles. Løsningen er heller ikke længere unik. På trods af disse fakta er numeriske algoritmer tilgængelige for at løse de tilhørende optimale projektionsligninger, som udgør nødvendige og tilstrækkelige betingelser for en lokalt optimal reduceret orden LQG-controller.

LQG -optimalitet sikrer ikke automatisk gode robusthedsegenskaber. Den robuste stabilitet i lukkede kredsløbssystemer skal kontrolleres separat, efter at LQG -controlleren er designet. For at fremme robusthed kan nogle af systemparametrene antages at være stokastiske i stedet for deterministiske. Det tilhørende vanskeligere kontrolproblem fører til en lignende optimal controller, hvoraf kun controllerens parametre er forskellige.

Det er muligt at beregne den forventede værdi af omkostningsfunktionen for de optimale gevinster samt ethvert andet sæt stabile gevinster.

Endelig bruges LQG-controlleren også til at styre forstyrrede ikke-lineære systemer.

Matematisk beskrivelse af problemet og løsningen

Kontinuerlig tid

Overvej det lineære dynamiske system med kontinuerlig tid

hvor repræsenterer vektoren af ​​systemvariabler i systemet, vektoren for kontrolindgange og vektoren af ​​målte output tilgængelige for feedback. Både additiv hvid gaussisk systemstøj og additiv hvid gaussisk målingstøj påvirker systemet. I betragtning af dette system er målet at finde kontrolindgangshistorikken, som til enhver tid kun kan afhænge lineært af tidligere målinger, således at følgende omkostningsfunktion minimeres:

hvor angiver den forventede værdi . Den sidste tid (horisont) kan enten være begrænset eller uendelig. Hvis horisonten har en tendens til uendelighed, bliver den første term i omkostningsfunktionen ubetydelig og irrelevant for problemet. Også for at holde omkostningerne begrænsede skal omkostningsfunktionen tages for at være .

LQG -controlleren, der løser LQG -kontrolproblemet, er specificeret af følgende ligninger:

Matrixen kaldes Kalman -forstærkningen for det tilhørende Kalman -filter repræsenteret af den første ligning. Hver gang genererer dette filter estimater af tilstanden ved hjælp af tidligere målinger og input. Kalman -forstærkningen beregnes ud fra matricerne , de to intensitetsmatricer, der er knyttet til de hvide gaussiske lyde og og endelig . Disse fem matricer bestemmer Kalman -gevinsten gennem følgende tilknyttede matrix Riccati -differentialligning:

I betragtning af løsningen er Kalman -gevinsten lig

Matrixen kaldes feedback gain -matrixen. Denne matrix bestemmes af matricerne og gennem følgende tilhørende matrix Riccati -differentialligning:

I betragtning af løsningen er feedbackgevinsten lig

Observer ligheden mellem de to matrix Riccati -differentialligninger, den første løber frem i tiden, den anden kører baglæns i tiden. Denne lighed kaldes dualitet . Den første matrix Riccati -differentialligning løser det lineære -kvadratiske estimeringsproblem (LQE). Den anden matrix Riccati -differentialligning løser det lineære -kvadratiske regulatorproblem (LQR). Disse problemer er dobbelte og tilsammen løser de det lineære -kvadratiske -gaussiske kontrolproblem (LQG). Så LQG -problemet adskiller sig til LQE- og LQR -problemet, der kan løses uafhængigt. Derfor kaldes LQG -problemet separerbart .

Hvornår og støjintensiteten matricer , afhænger ikke af og hvornår har tendens til uendelig LQG-controlleren bliver et tidsinvariant dynamisk system. I så fald kan den anden matrix Riccati -differentialligning blive erstattet af den tilhørende algebraiske Riccati -ligning .

Diskret tid

Da LQG-kontrolproblemet med diskret tid ligner det i kontinuerlig tid, fokuserer beskrivelsen nedenfor på de matematiske ligninger.

De lineære systemligninger for diskret tid er

Her repræsenterer det diskrete tidsindeks og repræsenterer diskrete Gauss-hvide støjprocesser med henholdsvis kovariansmatriser og er uafhængige af hinanden.

Den kvadratiske omkostningsfunktion, der skal minimeres, er

Den diskrete tid LQG-controller er

,

og svarer til det forudsigende skøn .

Kalman -gevinsten er lig med

hvor bestemmes af følgende matrix Riccati -differensligning, der løber frem i tiden:

Feedbackforstærkningsmatrixen er lig

hvor bestemmes af følgende matrix Riccati -differensligning, der kører baglæns i tiden:

Hvis alle matricer i problemformuleringen er tids-invariant, og hvis horisonten har tendens til uendelig, bliver LQG-controlleren med diskret tid tids-invariant. I så fald kan matricen Riccati-differensligninger erstattes af deres tilhørende diskret-tid algebraiske Riccati-ligninger . Disse bestemmer den tid-invariante lineære-kvadratiske estimator og den tids-invariante lineære-kvadratiske regulator i diskret tid. For at holde omkostningerne begrænsede i stedet for må man overveje i denne sag.

Se også

Referencer

Yderligere læsning