Gradient - Gradient

Gradienten, repræsenteret ved de blå pile, angiver retningen for den største ændring af en skalarfunktion. Funktionens værdier er repræsenteret i gråtoner og stigning i værdi fra hvid (lav) til mørk (høj).

I vektor regning , den gradient af en skalar-værdsat differentiable funktion f af flere variable er vektorfeltet (eller Vektorfunktion ) , hvis værdi i et punkt er vektoren hvis komponenter er de partielle afledede af på . Det vil sige, for dens gradient er defineret ved punktet i n- dimensionelt rum som vektoren:

Den nabla , som er skrevet som et omvendt trekant og udtales "del", betegner den vektor differensoperatoren .

Gradientvektoren kan tolkes som "retning og hastighed for hurtigste stigning". Hvis gradienten af ​​en funktion er ikke-nul ved et punkt p , er gradientens retning den retning, i hvilken funktionen stiger hurtigst fra p , og gradientens størrelse er stigningshastigheden i den retning, den største absolut retningsderivat. Desuden er gradienten nulvektoren på et punkt, hvis og kun hvis det er et stationært punkt (hvor derivatet forsvinder). Gradienten spiller således en fundamental rolle i optimeringsteorien , hvor den bruges til at maksimere en funktion ved gradientstigning .

Gradienten er dobbelt i forhold til det totale derivat : værdien af ​​gradienten på et punkt er en tangentvektor - en vektor ved hvert punkt; mens værdien af ​​derivatet på et punkt er en ko -tangentvektor - en lineær funktion på vektorer. De hænger sammen med, at prikproduktet af gradienten af f i et punkt p med en anden tangensvektor v er lig med retningsderivatet af f ved p af funktionen langs v ; det vil sige . Gradienten indrømmer flere generaliseringer til mere generelle funktioner på manifolder ; se § Generaliseringer .

Motivering

Gradient af 2D -funktionen f ( x , y ) = xe - ( x 2 + y 2 ) er afbildet som blå pile over funktionens pseudokolplot.

Betragt et rum, hvor temperaturen er givet ved et skalarfelt , T , så ved hvert punkt ( x , y , z ) er temperaturen T ( x , y , z ) , uafhængig af tid. På hvert punkt i rummet vil gradienten af T på det tidspunkt vise den retning, hvor temperaturen stiger hurtigst og bevæger sig væk fra ( x , y , z ) . Gradientens størrelse bestemmer, hvor hurtigt temperaturen stiger i den retning.

Betragt en overflade, hvis højde over havets overflade ved punkt ( x , y ) er H ( x , y ) . Gradienten af H på et punkt er en plan vektor, der peger i retning af den stejleste hældning eller grad på det tidspunkt. Hældningens stejlhed på det tidspunkt er givet ved størrelsen af ​​gradientvektoren.

Gradienten kan også bruges til at måle, hvordan et skalarfelt ændrer sig i andre retninger, snarere end bare retningen for den største ændring, ved at tage et prikprodukt . Antag, at den stejleste skråning på en bakke er 40%. En vej, der går direkte op ad bakke, har en hældning på 40%, men en vej, der går rundt om bakken i en vinkel, vil have en lavere hældning. For eksempel, hvis vejen er i en 60 ° vinkel fra opadgående retning (når begge retninger projiceres på vandret plan), vil hældningen langs vejen være prikproduktet mellem gradientvektoren og en enhedsvektor langs vejen , nemlig 40% gange cosinus på 60 ° eller 20%.

Mere generelt, hvis bakkehøjdefunktionen H er differentierbar , giver gradienten af H, der er stiplet med en enhedsvektor, bakkens hældning i vektorens retning, retningsderivatet af H langs enhedsvektoren.

Notation

Gradienten af ​​en funktion på et punkt skrives normalt som . Det kan også betegnes med en af ​​følgende:

  •  : for at understrege resultatet af vektoren.
  • grad f
  • og  : Einstein -notation .

Definition

Gradienten af ​​funktionen f ( x , y ) = - (cos 2 x + cos 2 y ) 2 afbildet som et projiceret vektorfelt på bundplanet.

Gradienten (eller gradient vektorfelt) af en skalar funktion f ( x 1 , x 2 , x 3 , ..., x n ) betegnes f eller f hvor ( nabla ) betegner vektor differensoperatoren , del . Notationen grad f bruges også almindeligt til at repræsentere gradienten. Gradienten af f er defineret som det unikke vektorfelt, hvis prikprodukt med en hvilken som helst vektor v ved hvert punkt x er retningsderivatet af f langs v . Det er,

Formelt er gradienten dobbelt i forhold til derivatet; se relation til derivat .

Når en funktion også afhænger af en parameter som tid, henviser gradienten ofte blot til vektoren for dens rumlige derivater (se Rumlig gradient ).

Gradientvektorens størrelse og retning er uafhængig af den særlige koordinatrepræsentation .

Kartesiske koordinater

I det tredimensionale kartesianske koordinatsystem med en euklidisk metrik , er gradienten, hvis den findes, givet ved:

hvor i , j , k er standard enhedsvektorer i retningerne for henholdsvis x- , y- og z -koordinaterne. For eksempel funktionens gradient

er

I nogle applikationer er det sædvanligt at repræsentere gradienten som en rækkevektor eller kolonnevektor af dens komponenter i et rektangulært koordinatsystem; denne artikel følger konventionen om, at gradienten er en søjlevektor, mens derivatet er en rækkevektor.

Cylindriske og sfæriske koordinater

I cylindriske koordinater med en euklidisk metric er gradienten givet ved:

hvor ρ er den aksiale afstand, φ er azimuthal- eller azimutvinklen, z er den aksiale koordinat, og e ρ , e φ og e z er enhedsvektorer, der peger langs koordinatretningerne.

I sfæriske koordinater er gradienten givet ved:

hvor r er den radiale afstand, φ er den azimutale vinkel og θ er den polare vinkel, og e r , e θ og e φ er igen lokale enhedsvektorer, der peger i koordinatretningerne (det vil sige det normaliserede kovariante grundlag ).

For gradient i andre ortogonale koordinatsystemer , se Ortogonale koordinater (Differentialoperatorer i tre dimensioner) .

Generelle koordinater

Vi betragter generelle koordinater , som vi skriver som x 1 ,…, x i ,…, x n , hvor n er antallet af dimensioner af domænet. Her refererer det øvre indeks til positionen på listen over koordinaten eller komponenten, så x 2 refererer til den anden komponent - ikke mængden x i kvadrat. Indeksvariablen i refererer til et vilkårligt element x i . Ved hjælp af Einstein -notation kan gradienten derefter skrives som:

(Bemærk at dens dobbelte er ),

hvor og henviser til de unormaliserede lokale kovariante og kontravariantbaser hhv., er den inverse metriske tensor , og Einstein -summationskonventionen indebærer summering over i og j .

Hvis koordinaterne er ortogonale, kan vi let udtrykke gradienten (og differentialet ) i form af de normaliserede baser, som vi omtaler som og ved hjælp af skalafaktorerne (også kendt som Lamé -koefficienter )  :

(og ),

hvor vi ikke kan bruge Einstein -notation, da det er umuligt at undgå gentagelse af mere end to indekser. Trods brugen af øvre og nedre indeks, , , og er hverken kontravariant eller covariant.

Sidstnævnte udtryk evaluerer til udtrykkene ovenfor for cylindriske og sfæriske koordinater.

Forhold til derivat

Forholdet til totalderivat

Gradienten er tæt forbundet med det samlede derivat ( total differential ) : de transponeres ( dobbelt ) til hinanden. Ved hjælp af konventionen om, at vektorer i er repræsenteret af kolonnevektorer , og at kovektorer (lineære kort ) er repræsenteret af rækkevektorer , udtrykkes gradienten og derivatet som henholdsvis en kolonne- og rækkevektor med de samme komponenter, men transponerer hver Andet:

Selvom disse begge har de samme komponenter, adskiller de sig i, hvilken slags matematisk objekt de repræsenterer: på hvert tidspunkt er derivatet en cotangentvektor , en lineær form ( covector ), der udtrykker, hvor meget (skalar) output ændres for en given infinitesimal ændring i (vektor) input, mens gradienten på hvert punkt er en tangentvektor , som repræsenterer en uendelig lille ændring i (vektor) input. I symboler, gradienten er et element af tangentrummet ved et punkt, mens derivatet er et kort fra tangentrummet til de reelle tal, . Tangentrummene ved hvert punkt i kan "naturligt" identificeres med selve vektorrummet , og på samme måde kan cotangentrummet ved hvert punkt naturligt identificeres med covektors dobbelte vektorrum ; således kan værdien af ​​gradienten på et punkt tænkes på en vektor i originalen , ikke kun som en tangentvektor.

Beregningsmæssigt, i betragtning af en tangentvektor, kan vektoren multipliceres med derivatet (som matricer), hvilket er lig med at tage prikproduktet med gradienten:

Differential eller (udvendigt) derivat

Den bedste lineære tilnærmelse til en differentierbar funktion

på et punkt x i R n er et lineært kort fra R n til R, som ofte betegnes med df x eller Df ( x ) og kaldes differentialet eller totalderivatet af f ved x . Funktionen df , som kortlægger x til df x , kaldes den totale differentiale eller ydre derivat af f og er et eksempel på en differential 1-form .

Ligesom derivatet af en funktion af en enkelt variabel repræsenterer hældningen af tangenten til funktionens graf, repræsenterer den retningsafledte af en funktion i flere variabler hældningen af tangenshyperplanet i vektorens retning.

Gradienten er relateret til differentialet ved hjælp af formlen

for enhver vR n , hvor er prikproduktet : at tage prikproduktet af en vektor med gradienten er det samme som at tage retningsderivatet langs vektoren.

Hvis R n ses som rummet for (dimension n ) kolonnevektorer (med reelle tal), kan man betragte df som rækkevektoren med komponenter

df x ( v ) er givet ved matrixmultiplikation . Forudsat standard -euklidisk metrik på R n , er gradienten derefter den tilsvarende kolonnevektor, det vil sige

Lineær tilnærmelse til en funktion

Den bedste lineære tilnærmelse til en funktion kan udtrykkes i gradient i stedet for derivatet. Gradienten af ​​en funktion f fra det euklidiske rum R n til R på et bestemt punkt x 0 i R n karakteriserer den bedste lineære tilnærmelse til f ved x 0 . Tilnærmelsen er som følger:

for x tæt på x 0 , hvor (∇ f  ) x 0 er gradienten af f beregnet ved x 0 , og prikken angiver prikproduktet på R n . Denne ligning svarer til de to første termer i den multivariable Taylor -serieudvidelse af fx 0 .

Forholdet til Fréchet -derivatet

Lad U være et åbent sæt i R n . Hvis funktionen f  : UR er differentiabel, så forskellen af f er Fréchet derivat af f . Således er f en funktion fra U til rummet R n, således at

hvor · er prikproduktet.

Som en konsekvens holder derivatets sædvanlige egenskaber for gradienten, selvom gradienten ikke er et derivat i sig selv, men snarere dobbelt i forhold til derivatet:

Linearitet

Gradienten er lineær i den forstand, at hvis f og g er to reelt værdsatte funktioner, der er differentierbare ved punktet aR n , og α og β er to konstanter, så er αf + βg differentierbar ved a , og desuden

Produktregel

Hvis f og g er reelt værdsatte funktioner, der kan differentieres i et punkt aR n , hævder produktreglen, at produktet fg er differentierbart ved a , og

Kæderegel

Antag, at f  : AR er en reelt værdsat funktion defineret på en delmængde A af R n , og at f er differentierbar i et punkt a . Der er to former for kædereglen, der gælder for gradienten. Antag først, at funktionen g er en parametrisk kurve ; det vil sige en funktion g  : IR n kortlægger et delsæt IR til R n . Hvis g er differentierbar ved et punkt cI sådan at g ( c ) = a , så

hvor ∘ er sammensætningsoperatoren : (  f  ∘  g ) ( x ) = f ( g ( x )) .

Mere generelt, hvis i stedet IR k , så gælder følgende:

hvor ( Dg ) T betegner den transponerende jacobiske matrix .

For den anden form af kæden regel antage, at h  : IR er en reel værdsat funktion på en delmængde I af R , og at h er differentiabel i punktet f ( a ) ∈ jeg . Derefter

Yderligere egenskaber og applikationer

Niveau sæt

En plan overflade, eller isosurface , er sættet af alle punkter, hvor en funktion har en given værdi.

Hvis f er differentierbar, giver punktproduktet (∇ f  ) xv af gradienten i et punkt x med en vektor v retningsderivatet af f ved x i retningen v . Det følger heraf, at gradient på i dette tilfælde f er ortogonal til niveau sæt af f . For eksempel er en plan overflade i tredimensionelt rum defineret ved en ligning med formen F ( x , y , z ) = c . Gradienten af F er derefter normal til overfladen.

Mere generelt kan enhver indlejret overflade i en Riemannian manifold skæres ud med en ligning med formen F ( P ) = 0, således at dF ingen steder er nul. Gradienten af F er derefter normal over for overfladen.

På samme måde kan en affin algebraisk overflade defineres ved en ligning F ( x 1 , ..., x n ) = 0 , hvor F er et polynom. Gradienten af F er nul ved et entalpunkt på overfladen (dette er definitionen på et ental punkt). På et ikke-ental punkt er det en normal nul-vektor.

Konservative vektorfelter og gradient sætning

Gradienten af ​​en funktion kaldes et gradientfelt. Et (kontinuerligt) gradientfelt er altid et konservativt vektorfelt : dets linieintegral langs en hvilken som helst sti afhænger kun af stens endepunkter og kan evalueres af gradientsætningen (grundsætningen for beregning for linjeintegraler). Omvendt er et (kontinuerligt) konservativt vektorfelt altid gradienten af ​​en funktion.

Generaliseringer

Jacobian

Den jacobiske matrix er generaliseringen af ​​gradienten for vektorværdierede funktioner i flere variabler og differentierbare kort mellem euklidiske rum eller mere generelt manifolder . En yderligere generalisering for en funktion mellem Banach -rum er Fréchet -derivatet .

Antag at f  : ℝ n → ℝ m er en funktion, så hver af dens førsteordens partielle derivater findes på n . Derefter er den jacobiske matrix af f defineret til at være en m × n matrix, betegnet med eller ganske enkelt . Den ( i , j ) th post er . Eksplicit

Gradient af et vektorfelt

Da det samlede derivat af et vektorfelt er en lineær kortlægning fra vektorer til vektorer, er det en tensormængde .

I rektangulære koordinater er gradienten af ​​et vektorfelt f = (  f 1 , f 2 , f 3 ) defineret af:

(hvor Einstein -summeringsnotationen bruges, og tensorproduktet af vektorerne e i og e k er en dyadisk tensor af typen (2,0)). Samlet set er dette udtryk lig med transponeringen af ​​den jakobiske matrix:

I krumme lineære koordinater eller mere generelt på en buet manifold involverer gradienten Christoffel -symboler :

hvor g jk er komponenterne i den inverse metriske tensor og e i er koordinatbasisvektorerne.

Udtrykt mere uvægerligt kan gradienten af ​​et vektorfelt f defineres af Levi-Civita-forbindelsen og metriske tensor:

hvor c er forbindelsen.

Riemanniske manifolds

For enhver glat funktion f på en Riemannian manifold ( M , g ) er gradienten af f vektorfeltet f sådan, at for ethvert vektorfelt X ,

det er,

hvor g x (,) betegner det indre produkt af tangensvektorer ved x defineret af metrisk g og X f er den funktion, der tager et hvilket som helst punkt xM til retningsderivatet af f i retning X , evalueret ved x . Med andre ord, i et koordinatdiagram φ fra et åbent undersæt af M til et åbent undersæt af R n , er (∂ X f  ) ( x ) givet ved:

hvor X j angiver den j.komponent i X i dette koordinatdiagram.

Så den lokale form af gradienten har formen:

Ved at generalisere sagen M = R n er gradient af en funktion relateret til dens ydre derivat, siden

Mere præcist er gradienten f vektorfeltet, der er knyttet til differential 1-form df ved hjælp af den musikalske isomorfisme

(kaldet "skarp") defineret af metrisk g . Forholdet mellem det udvendige derivat og gradienten af ​​en funktion på R n er et specielt tilfælde af dette, hvor metricen er den flade metric givet af prikproduktet.

Se også

Noter

Referencer

  • Bachman, David (2007), Advanced Calculus Demystified , New York: McGraw-Hill , ISBN 978-0-07-148121-2
  • Beauregard, Raymond A .; Fraleigh, John B. (1973), Et første kursus i lineær algebra: med valgfri introduktion til grupper, ringe og felter , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
  • Downing, Douglas, ph.d. (2010), Barrons EZ Calculus , New York: Barron's , ISBN 978-0-7641-4461-5
  • Dubrovin, BA; Fomenko, AT; Novikov, SP (1991). Moderne geometri — Metoder og applikationer: Del I: Geometri af overflader, transformationsgrupper og felter . Kandidattekster i matematik (2. udgave). Springer. ISBN 978-0-387-97663-1.
  • Harper, Charlie (1976), Introduction to Mathematical Physics , New Jersey: Prentice-Hall , ISBN 0-13-487538-9
  • Kreyszig, Erwin (1972), Advanced Engineering Mathematics (3. udgave), New York: Wiley , ISBN 0-471-50728-8
  • "McGraw Hill Encyclopedia of Science & Technology". McGraw-Hill Encyclopedia of Science & Technology (10. udgave). New York: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
  • Moise, Edwin E. (1967), Calculus: Complete , Reading: Addison-Wesley
  • Protter, Murray H .; Morrey, Jr., Charles B. (1970), College Calculus with Analytic Geometry (2. udgave), Reading: Addison-Wesley , LCCN  76087042
  • Schey, HM (1992). Div, Grad, Curl og alt det (2. udgave). WW Norton. ISBN 0-393-96251-2. OCLC  25048561 .
  • Stoker, JJ (1969), Differential Geometry , New York: Wiley , ISBN 0-471-82825-4
  • Swokowski, Earl W .; Olinick, Michael; Pence, Dennis; Cole, Jeffery A. (1994), Calculus (6. udgave), Boston: PWS Publishing Company, ISBN 0-534-93624-5

Yderligere læsning

  • Korn, Theresa M .; Korn, Granino Arthur (2000). Matematisk håndbog for forskere og ingeniører: Definitioner, sætninger og formler til reference og gennemgang . Dover Publications. s. 157–160. ISBN 0-486-41147-8. OCLC  43864234 .

eksterne links