Bestemt matrix - Definite matrix

I matematik er en symmetrisk matrix med reelle poster positiv-bestemt, hvis det reelle tal er positivt for hver ikke-nul reel kolonnevektor, hvor er transponeringen af . Mere generelt er en hermitisk matrix (det vil sige en kompleks matrix svarende til dens konjugerede transponering ) positiv-bestemt, hvis det reelle tal er positivt for hver kompleks nul-kompleks søjlevektor, hvor betegner konjugeret transponering af

Positive semi-bestemte matricer defineres på samme måde, bortset fra at skalarerne og skal være positive eller nul (det er ikke-negativt). Negative-bestemte og negative semi-bestemte matricer defineres analogt. En matrix, der ikke er positiv semidefinitiv og ikke negativ semidefinitiv, kaldes undertiden ubestemt .

En matrix er således positiv-bestemt, hvis og kun hvis den er matrixen for en positiv-bestemt kvadratisk form eller hermitisk form . Med andre ord er en matrix positiv-bestemt, hvis og kun hvis den definerer et indre produkt .

Positive-bestemte og positive-semidefinite matricer kan karakteriseres på mange måder, hvilket kan forklare betydningen af ​​begrebet i forskellige dele af matematikken. En matrix M er positiv-bestemt, hvis og kun hvis den opfylder nogen af ​​følgende ækvivalente betingelser.

  • M er kongruent med en diagonal matrix med positive reelle poster.
  • M er symmetrisk eller hermitisk, og alle dens egenværdier er reelle og positive.
  • M er symmetrisk eller hermitisk, og alle dens ledende mindreårige er positive.
  • Der findes en inverterbar matrix med konjugeret transponering, således at

En matrix er positiv halvdefinit, hvis den opfylder lignende ækvivalente betingelser, hvor "positiv" erstattes af "ikke-negativ" og "inverterbar matrix" erstattes af "matrix".

Positive-bestemte og positive-semidefinite reelle matricer er grundlaget for konveks optimering , da givet en funktion af flere reelle variabler, der er to forskellige differentierbare , så hvis dens hessiske matrix (matrix af dets andet partielle derivater) er positiv-bestemt ved en punkt p , så er funktionen konveks nær p , og omvendt, hvis funktionen er konveks nær p , så er den hessiske matrix positiv-semidefinit ved p .

Nogle forfattere bruger mere generelle definitioner af bestemthed, herunder nogle ikke-symmetriske reelle matricer eller ikke-hermitiske komplekse.

Definitioner

I de følgende definitioner er transponering af , er konjugeret transponering af og betegner den n -dimensionelle nul -vektor.

Definitioner for rigtige matricer

En symmetrisk reel matrix siges at være positiv-bestemt hvis for alle ikke-nul in . Formelt,

En symmetrisk reel matrix siges at være positiv semidefinit eller ikke-negativ-bestemt hvis for all in . Formelt,

En symmetrisk reel matrix siges at være negativ-bestemt hvis for alle ikke-nul in . Formelt,

En symmetrisk reel matrix siges at være negativ-semidefinit eller ikke-positiv-bestemt hvis for all in . Formelt,

En symmetrisk reel matrix, der hverken er positiv semidefinit eller negativ semidefinit, kaldes på ubestemt tid .

Definitioner for komplekse matricer

De følgende definitioner involverer alle udtrykket . Bemærk, at dette altid er et reelt tal for enhver hermitisk firkantmatrix .

En hermitisk kompleks matrix siges at være positiv-bestemt, hvis for alle ikke-nul in . Formelt,

En hermitisk kompleks matrix siges at være positiv semi-bestemt eller ikke-negativ-bestemt hvis for all in . Formelt,

En hermitisk kompleks matrix siges at være negativ-bestemt, hvis for alle ikke-nul in . Formelt,

En hermitisk kompleks matrix siges at være negativ semi-bestemt eller ikke-positiv-bestemt hvis for all in . Formelt,

En hermitisk kompleks matrix, der hverken er positiv semidefinit eller negativ semidefinit, kaldes på ubestemt tid .

Overensstemmelse mellem reelle og komplekse definitioner

Da hver ægte matrix også er en kompleks matrix, må definitionerne af "bestemthed" for de to klasser stemme overens.

For komplekse matricer siger den mest almindelige definition, at " er positiv-bestemt, hvis og kun hvis den er reel og positiv for alle ikke-nul komplekse kolonnevektorer ". Denne betingelse indebærer, at det er hermitisk (dvs. dets gennemførelse er lig med dets konjugat). For at se dette skal du overveje matricerne og , så og . Matricerne og er hermitiske, derfor og er individuelt virkelige. Hvis det er virkeligt, skal det være nul for alle . Så er nulmatrixen, og som beviser, at det er hermitisk.

Ved denne definition er en positiv-bestemt reel matrix hermitisk, derfor symmetrisk; og er positiv for alle reelle søjlevektorer uden nul . Den sidste betingelse er imidlertid ikke alene tilstrækkelig til at være positiv-bestemt. For eksempel hvis

derefter for enhver rigtig vektor med poster, og vi har , hvilket altid er positivt, hvis det ikke er nul. Men hvis er den komplekse vektor med poster og , får man

hvilket ikke er virkeligt. Derfor er det ikke positivt-bestemt.

På den anden side, for et symmetrisk reel matrix , betingelsen " for alle ikke-nul reelle vektorer " betyder indebærer, at er positiv-konkret i komplekset forstand.

Notation

Hvis en hermitisk matrix er positiv semidefinitiv, skriver man nogle gange, og hvis den er positiv-bestemt, skriver man . For at angive, at det er negativt halvt bestemt, skriver man og for at betegne det, er det negativt bestemt, man skriver .

Begrebet kommer fra funktionel analyse, hvor positive semidefinite matricer definerer positive operatorer .

En fælles alternativ notation er , , og for positive semi-bestemte og positive-bestemt, negative semi-bestemte og negative-konkret matricer hhv. Dette kan være forvirrende, da undertiden ikke -negative matricer (henholdsvis ikke -positive matricer) også betegnes på denne måde.

Eksempler

  • Den identitet matrix er positiv-konkret (og som sådan også positiv semi-bestemt). Det er en reel symmetrisk matrix, og for enhver ikke-nul kolonnevektor z med reelle poster a og b har man
    .

    Set som en kompleks matrix, for enhver ikke-nul kolonnevektor z med komplekse poster a og b, man har

    .
    Uanset hvad, er resultatet positivt, da det ikke er nulvektoren (det vil sige mindst en af og ikke er nul).
  • Den virkelige symmetriske matrix
    er positiv-bestemt, da vi for enhver ikke-nul kolonnevektor z med posterne a , b og c har
    Dette resultat er en sum af kvadrater og derfor ikke-negativ; og er kun nul, hvis , det vil sige når z er nulvektoren.
  • For enhver reel invertibel matrix er produktet en positiv bestemt matrix (hvis midlerne i kolonnerne i A er 0, kaldes dette også kovariansmatrixen ). Et simpelt bevis er, at for enhver ikke-nul-vektor betyder betingelsen siden matrixens invertibilitet , at
  • Eksemplet ovenfor viser, at en matrix, hvor nogle elementer er negative, stadig kan være positiv bestemt. Omvendt er en matrix, hvis poster alle er positive, ikke nødvendigvis positiv bestemt, som f.eks
    for hvilket

Eigenværdier

Lad være en hermitisk matrix (dette inkluderer ægte symmetriske matricer ). Alle egenværdier af er reelle, og deres tegn kendetegner dets bestemthed:

  • er positiv bestemt, hvis og kun hvis alle dens egenværdier er positive.
  • er positiv semi-bestemt, hvis og kun hvis alle dens egenværdier er ikke-negative.
  • er negativ bestemt, hvis og kun hvis alle dens egenværdier er negative
  • er negativ semi-bestemt, hvis og kun hvis alle dens egenværdier er ikke-positive.
  • er ubestemt, hvis og kun hvis den har både positive og negative egenværdier.

Lad være en egen sammensætning af , hvor er en kompleks kompleks matrix, hvis søjler udgør et ortonormalt grundlag for egenvektorer af , og er en reel diagonal matrix, hvis hoveddiagonal indeholder de tilsvarende egenværdier . Matricen kan betragtes som en diagonal matrix, der er blevet genudtrykt i koordinater for (egenvektorerne) . Sagt anderledes, at anvende M på en vektor z i vores koordinatsystem ( M z ) er det samme som at ændre grundlaget for vores z til egenvektorkoordinatsystemet ved hjælp af P −1 ( P −1 z ), anvende strækningstransformationen D til det ( DP −1 z ), og derefter ændre grundlaget tilbage til vores system ved hjælp af P ( PDP −1 z ).

Med dette i tankerne viser en-til-en ændringen af ​​variablen , at der er reel og positiv for enhver kompleks vektor, hvis og kun hvis den er reel og positiv for enhver ; med andre ord, hvis det er positivt bestemt. For en diagonal matrix er dette kun sandt, hvis hvert element i hoveddiagonalen - det vil sige hver egenværdi af - er positiv. Da spektralsætningen garanterer, at alle egenværdier i en hermitisk matrix er reelle, kan egenværdiernes positivitet kontrolleres ved hjælp af Descartes 'regel om vekslende tegn, når det karakteristiske polynom for en reel, symmetrisk matrix er tilgængelig.

Nedbrydning

Lad være en hermitisk matrix . er positiv semidefinit, hvis og kun hvis det kan nedbrydes som et produkt

af en matrix med dens konjugerede transponering .

Når er reel, kan den også være reel, og nedbrydningen kan skrives som

er positiv bestemt, hvis og kun hvis en sådan nedbrydning eksisterer med invertibel . Mere generelt er positiv semidefinit med rang, hvis og kun hvis der findes en dekomponering med en matrix med fuld rækkerangering (dvs. af rang ). Desuden er det for enhver nedbrydning , .

Bevis

Hvis , så , så er positiv semidefinite. Hvis derudover er inverterbar, er uligheden streng for , så er positiv bestemt. Hvis er af rang , så .

I den anden retning antages det at være positivt semidefinit. Siden er hermitisk, har den en egenkomposition, hvor er unitær og er en diagonal matrix, hvis poster er egenværdierne for Siden er positive semidefinite, egenværdierne er ikke-negative reelle tal, så man kan definere som den diagonale matrix, hvis poster er ikke-negative kvadratrødder af egenværdier. Derefter for . Hvis derudover er positiv bestemt, så er egenværdierne (strengt) positive, så er inverterbare og derfor også inverterbare. Hvis har rang , så har den nøjagtigt positive egenværdier, og de andre er nul, derfor nulstilles alle i alle undtagen rækker. At skære nulrækkerne giver en matrix sådan .

Kolonnerne af kan ses som vektorer i henholdsvis det komplekse eller det reelle vektorrum . Så de registreringer er indre produkter (der er dot produkter , i den virkelige tilfælde) af disse vektorer

Med andre ord er en hermitisk matrix positiv semidefinit, hvis og kun hvis det er grammatricen for nogle vektorer . Det er positivt bestemt, hvis og kun hvis det er Gram -matrixen for nogle lineært uafhængige vektorer. Generelt er rangen af ​​Gram -matricen for vektorer lig med dimensionen af ​​det rum, der spænder over disse vektorer.

Unikhed op til enhedstransformationer

Nedbrydningen er ikke unik: hvis for en matrix, og hvis der er en hvilken som helst enhedsmatrix (betydning ), så for .

Dette er imidlertid den eneste måde, hvorpå to nedbrydninger kan adskille sig: nedbrydningen er unik op til enhedstransformationer . Mere formelt, hvis er en matrix og er en matrix sådan, at der er en matrix med orthonormale kolonner (betyder ) sådan . Når dette middel er enhetligt .

Denne erklæring har en intuitiv geometrisk fortolkning i det virkelige tilfælde: lad kolonnerne af og være vektorer og ind . En reel enhedsmatrix er en ortogonal matrix , der beskriver en stiv transformation (en isometri af det euklidiske rum ), der bevarer 0 -punktet (dvs. rotationer og refleksioner uden oversættelser). Derfor prikker produkterne og er ens, hvis og kun hvis en stiv transformation af transformerer vektorerne til (og 0 til 0).

Kvadrat rod

En matrix er positiv semidefinit, hvis og kun hvis der er en positiv semidefinitmatrix (især hermetisk, så ) tilfredsstillende . Denne matrix er unik, kaldes den ikke-negative kvadratrod af og betegnes med . Når er positiv bestemt, så er det , derfor kaldes det også den positive kvadratrod af .

Den ikke-negative kvadratrod må ikke forveksles med andre nedbrydninger . Nogle forfattere bruger navnet kvadratrod og til enhver sådan nedbrydning, eller specifikt til Cholesky -nedbrydningen eller enhver nedbrydning af formen ; andre bruger det kun til den ikke-negative kvadratrod.

Hvis så .

Cholesky nedbrydning

En positiv semidefinit matrix kan skrives som , hvor er lavere trekantet med ikke-negativ diagonal (ækvivalent hvor er øvre trekantet); dette er den Cholesky nedbrydning . Hvis er positiv bestemt, så er diagonalen af positiv, og den koleskiske nedbrydning er unik. Cholesky -nedbrydningen er især nyttig til effektive numeriske beregninger. Et nært beslægtet nedbrydning er LDL nedbrydning , , hvor er diagonal og er lavere unitriangular .

Andre karakteriseringer

Lad være en hermitisk matrix . Følgende egenskaber svarer til at være positive bestemte:

Den tilhørende sesquilinære form er et indre produkt
Den sesquilinære form defineret af er funktionen fra til sådan, at for alle og i , hvor er den konjugerede transponering af . For enhver kompleks matrix er denne form lineær ind og semilinjær i . Derfor er formen et indre produkt på, hvis og kun hvis det er reelt og positivt for alle ikke -nul ; det er hvis og kun hvis det er positivt bestemt. (Faktisk opstår hvert indre produkt på denne måde fra en hermitisk positiv bestemt matrix.)
Dets ledende mindreårige er alle positive
Det k th førende hovedmoll i en matrix er determinanten for dens sub-matrix øverst til venstre . Det viser sig, at en matrix er positiv bestemt, hvis og kun hvis alle disse determinanter er positive. Denne tilstand er kendt som Sylvesters kriterium og giver en effektiv test af positiv bestemthed af en symmetrisk reel matrix. Matrixen reduceres nemlig til en øvre trekantet matrix ved hjælp af elementære rækkeoperationer , som i den første del af den gaussiske eliminationsmetode , idet man sørger for at bevare tegnet på dens determinant under drejningsprocessen . Da det k th førende hovedmoll i en trekantet matrix er produktet af dets diagonale elementer op til række , er Sylvesters kriterium ækvivalent med at kontrollere, om dets diagonale elementer alle er positive. Denne betingelse kan kontrolleres hver gang der opnås en ny række af den trekantede matrix.

En positiv semidefinit matrix er positiv bestemt, hvis og kun hvis den er inverterbar . En matrix er negativ (semi) bestemt, hvis og kun hvis den er positiv (semi) bestemt.

Kvadratiske former

Den (rent) kvadratiske form, der er forbundet med en reel matrix, er funktionen sådan, at for alle . kan antages symmetrisk ved at erstatte den med .

En symmetrisk matrix er positiv bestemt, hvis og kun hvis dens kvadratiske form er en strengt konveks funktion .

Mere generelt kan enhver kvadratisk funktion fra til skrives som hvor er en symmetrisk matrix, er en reel -vektor og en reel konstant. Denne kvadratiske funktion er strengt konveks og har derfor et unikt begrænset globalt minimum, hvis og kun hvis det er positivt bestemt. Af denne grund spiller positive bestemte matricer en vigtig rolle i optimeringsproblemer .

Samtidig diagonalisering

En symmetrisk matrix og en anden symmetrisk og positiv bestemt matrix kan diagonaliseres samtidigt , dog ikke nødvendigvis via en lighedstransformation . Dette resultat omfatter ikke tre eller flere matricer. I dette afsnit skriver vi for den virkelige sag. Udvidelse til den komplekse sag er øjeblikkelig.

Lad være en symmetrisk og en symmetrisk og positiv bestemt matrix. Skriv den generaliserede egenværdi ligning som hvor vi pålægger at normaliseres, dvs. . Nu bruger vi Cholesky dekomponering til at skrive det inverse af as . Multiplicere med og lade , får vi , som kan omskrives som hvor . Manipulation giver nu, hvor er en matrix, der som søjler har de generaliserede egenvektorer og er en diagonal matrix for de generaliserede egenværdier. Nu giver førmultiplikation med det endelige resultat: og , men bemærk, at dette ikke længere er en ortogonal diagonalisering med hensyn til det indre produkt, hvor . Faktisk diagonaliserede vi med hensyn til det indre produkt fremkaldt af .

Bemærk, at dette resultat ikke modsiger det, der siges om samtidig diagonalisering i artiklen Diagonaliserbar matrix , der refererer til samtidig diagonalisering ved en lighedstransformation. Vores resultat her ligner mere en samtidig diagonalisering af to kvadratiske former og er nyttig til optimering af den ene form under betingelser på den anden.

Ejendomme

Fremkaldt delvis bestilling

For vilkårlige kvadratiske matricer , vi skriver om det vil sige, er positiv semi-bestemt. Dette definerer en delvis rækkefølge på sættet af alle firkantede matricer. Man kan på samme måde definere en streng delvis ordning . Bestillingen kaldes Loewner -ordren .

Omvendt af positiv bestemt matrix

Hver positiv bestemt matrix er inverterbar, og dens inverse er også positiv bestemt. Hvis så . Desuden ved den min-maks teorem , den k th største egenværdi af er større end k th største egenværdi af .

Skalering

Hvis det er positivt bestemt og er et reelt tal, er det positivt bestemt.

Tilføjelse

  • Hvis og er positiv-bestemt, så er summen også positiv-bestemt.
  • Hvis og er positiv-semidefinit, så er summen også positiv-semidefinit.
  • Hvis er positiv-bestemt og er positiv-semidefinit, så er summen også positiv-bestemt.

Multiplikation

  • Hvis og er positive bestemte, så er produkterne og også positive bestemte. Hvis , så er også positivt bestemt.
  • Hvis er positiv semidefinit, så er positiv semidefinit positiv for enhver (muligvis rektangulær) matrix . Hvis er positiv bestemt og har fuld kolonne rang, så er positiv bestemt.

Spor

De diagonale poster i en positiv-semidefinit matrix er reelle og ikke-negative. Som en konsekvens af spor , . Da hver hovedundermatrix (især 2-for-2) desuden er positiv semidefinit,

og dermed, når ,

En hermitisk matrix er positiv bestemt, hvis den opfylder følgende sporforskelle:

Et andet vigtigt resultat er, at for enhver og positiv-semidefinit matricer,

Hadamard produkt

Hvis Hadamard -produktet , selvom det ikke er nødvendigt med positivt semidefinit, er (dette resultat kaldes ofte Schur -produktsætningen ).

Hvad angår Hadamard -produktet af to positive semidefinite -matricer , er der to bemærkelsesværdige uligheder:

  • Oppenheims ulighed:
  • .

Kronecker produkt

Hvis , selvom det ikke er nødvendigt positivt semidefinit, Kronecker -produktet .

Frobenius produkt

Hvis , selv om det ikke er nødvendigt positivt semidefinit, Frobenius indre produkt (Lancaster – Tismenetsky, The Theory of Matrices , s. 218).

Konveksitet

Sættet med positive semidefinite symmetriske matricer er konveks . Det vil sige, hvis og er positive semidefinite, så for enhver mellem 0 og 1, er også positiv semidefinit. For enhver vektor :

Denne egenskab garanterer, at semidefinite programmeringsproblemer konvergerer til en globalt optimal løsning.

Forholdet til cosinus

Den positive bestemthed af en matrix udtrykker, at vinklen mellem enhver vektor og dens billede altid er :

Yderligere ejendomme

  1. Hvis er en symmetrisk Toeplitz -matrix , dvs. indtastningerne er givet som en funktion af deres absolutte indeksforskelle:, og den strenge ulighed holder, så er strengt positiv bestemt.
  2. Let og Hermitian. Hvis (hhv. ), Derefter (hhv. ).
  3. Hvis det er virkeligt, så er der et sådant , hvor er identitetsmatricen .
  4. Hvis betegner den førende minor, er k th -omdrejningspunktet under LU -nedbrydning .
  5. En matrix er negativ bestemt, hvis dens k- th rækkefølge ledende mindreårige er negativ når er ulige, og positiv når er lige.

En hermitisk matrix er positiv semidefinit, hvis og kun hvis alle dens mindreårige ikke er negative. Det er imidlertid ikke nok kun at overveje de førende hovedmindreårige, som det er markeret på den diagonale matrix med indtastning 0 og -1.

Blok matricer og submatricer

En positiv matrix kan også defineres af blokke :

hvor hver blok er . Ved at anvende positivitetstilstanden følger det straks det og er hermitiske, og .

Vi har det for alle komplekse , og især for . Derefter

Et lignende argument kan anvendes på , og dermed konkluderer vi, at både og skal være positivt bestemt. Argumentet kan udvides til at vise, at enhver hovedundermatrix af sig selv er positiv bestemt.

Omvendte resultater kan bevises med stærkere forhold på blokkene, for eksempel ved hjælp af Schur -komplementet .

Lokalt ekstrema

En generel kvadratisk form på reelle variabler kan altid skrives som hvor er kolonnevektoren med disse variabler og er en symmetrisk reel matrix. Derfor betyder matrixen at være positiv bestemt, der har et unikt minimum (nul), når det er nul, og er strengt positivt for alle andre .

Mere generelt har en todifferentierbar reel funktion på reelle variabler lokalt minimum ved argumenter, hvis dens gradient er nul, og dens hessian (matrixen for alle andre derivater) er positiv semi-bestemt på det tidspunkt. Lignende udsagn kan fremsættes for negative bestemte og semi-bestemte matricer.

Kovarians

I statistik er kovariansmatricen for en multivariat sandsynlighedsfordeling altid positiv halvdefinit; og det er positivt bestemt, medmindre en variabel er en nøjagtig lineær funktion af de andre. Omvendt er hver positiv semi-bestemt matrix kovariansmatrixen for en eller anden multivariat distribution.

Forlængelse til ikke-hermitiske firkantmatricer

Definitionen af ​​positiv bestemt kan generaliseres ved at angive enhver kompleks matrix (f.eks. Reel ikke-symmetrisk) som positiv bestemt, hvis for alle ikke-nul komplekse vektorer , hvor betegner den reelle del af et komplekst tal . Kun den hermitiske del bestemmer, om matricen er positiv bestemt, og vurderes i den snævrere forstand ovenfor. På samme måde, hvis og er reelle, har vi for alle reelle ikke -nulvektorer, hvis og kun hvis den symmetriske del er positiv bestemt i den snævrere forstand. Det er umiddelbart klart, at er ufølsom over for gennemførelse af M .

Følgelig behøver en ikke-symmetrisk reel matrix med kun positive egenværdier ikke at være positiv bestemt. For eksempel har matrixen positive egenværdier, men den er ikke positiv bestemt; især opnås en negativ værdi af med valget (som er egenvektoren forbundet med den negative egenværdi af den symmetriske del af ).

Sammenfattende er det kendetegnende mellem den virkelige og komplekse sag, at en afgrænset positiv operator på et komplekst Hilbert -rum nødvendigvis er hermitisk eller selvtilknyttet. Den generelle påstand kan argumenteres ved hjælp af polariseringsidentiteten . Det er ikke længere sandt i det virkelige tilfælde.

Ansøgninger

Varmeledningsevne matrix

Fouriers lov om varmeledning, der giver varmeflux i form af temperaturgradienten, er skrevet for anisotropiske medier som , hvori den er symmetrisk varmeledningsevne matrix. Det negative er indsat i Fouriers lov for at afspejle forventningen om, at varme altid vil flyde fra varm til kold. Med andre ord, da temperaturgradienten altid peger fra kold til varm, forventes varmefluxen at have et negativt indre produkt med, så . Udskiftning af Fouriers lov giver derefter denne forventning som , hvilket indebærer, at konduktivitetsmatricen skal være positiv bestemt.

Se også

Noter

Referencer

eksterne links