Differential af en funktion - Differential of a function

I calculus , den forskellen repræsenterer hoveddelen af ændringen i en funktion y  =  f ( x ) i forhold til ændringer i den uafhængige variabel. Differentiel dy er defineret af

hvor er derivatet af f med hensyn til x , og dx er en ekstra reel variabel (så dy er en funktion af x og dx ). Notationen er sådan, at ligningen

holder, hvor derivatet er repræsenteret i Leibniz -notationen dy / dx , og dette er i overensstemmelse med at betragte derivatet som kvotienten for differentialerne. Man skriver også

Den præcise betydning af variablerne dy og dx afhænger af applikationens kontekst og det krævede niveau af matematisk stringens. Disse variabels domæne kan få en særlig geometrisk betydning, hvis differencen betragtes som en bestemt differentialform , eller analytisk betydning, hvis differencen betragtes som en lineær tilnærmelse til forøgelsen af ​​en funktion. Traditionelt anses variablerne dx og dy for at være meget små ( uendelige ), og denne fortolkning gøres streng i ikke-standardiseret analyse .

Historie og brug

Differencen blev først introduceret via en intuitiv eller heuristisk definition af Isaac Newton og videreført af Gottfried Leibniz , der tænkte på differential  dy som en uendelig lille (eller uendelig ) ændring i funktionens værdi  y , svarende til en uendelig lille ændring  dx i funktionens argument  x . Af den grund er den øjeblikkelige ændringshastighed for y med hensyn til x , som er værdien af ​​funktionens derivat , angivet med fraktionen

i det, der kaldes Leibniz -betegnelsen for derivater. Kvotienten dy / dx er ikke uendelig lille; det er snarere et reelt tal .

Brugen af ​​uendelige tal i denne form blev meget kritiseret, for eksempel af den berømte pjece The Analyst af biskop Berkeley. Augustin-Louis Cauchy ( 1823 ) definerede forskellen uden appel til atomismen i Leibniz 'uendelige dimensioner. I stedet vendte Cauchy, efter d'Alembert , den logiske rækkefølge af Leibniz og hans efterfølgere: selve derivatet blev det grundlæggende objekt, defineret som en grænse for forskelskvotienter, og differentialerne blev derefter defineret i form af det. Det vil sige, at man frit kunne definere differentialet dy ved et udtryk

hvor dy og dx simpelthen er nye variabler, der tager endelige reelle værdier, ikke faste uendelige tal, som de havde været for Leibniz.

Ifølge Boyer (1959 , s. 12) var Cauchys tilgang en væsentlig logisk forbedring i forhold til den uendelige tilgang til Leibniz, fordi mængderne dy og dx nu i stedet for at påberåbe sig den metafysiske forestilling om infinitesimale nu kunne manipuleres på nøjagtig samme måde som enhver anden reel mængde på en meningsfuld måde. Cauchys overordnede konceptuelle tilgang til differentier forbliver standard i moderne analytiske behandlinger, selvom det sidste ord om stringens, en fuldt moderne opfattelse af grænsen, i sidste ende skyldtes Karl Weierstrass .

I fysiske behandlinger, som dem, der anvendes på teorien om termodynamik , hersker det uendelige syn stadig. Courant & John (1999 , s. 184) forener den fysiske brug af uendelige små forskelle med den matematiske umulighed af dem som følger. Differenserne repræsenterer begrænsede ikke-nul-værdier, der er mindre end den nøjagtighedsgrad, der kræves til det særlige formål, de er beregnet til. Således behøver "fysiske uendelige" ikke appellere til en tilsvarende matematisk uendelig lille for at have en præcis sans.

Efter det 20. århundredes udvikling inden for matematisk analyse og differential geometri blev det klart, at forestillingen om differentiering af en funktion kunne udvides på forskellige måder. I reel analyse er det mere ønskeligt at beskæftige sig direkte med differentialet som hoveddelen af ​​forøgelsen af ​​en funktion. Dette fører direkte til forestillingen om, at differentialet af en funktion på et punkt er en lineær funktion af et trin Δ x . Denne tilgang gør det muligt at udvikle differentialet (som et lineært kort) til en række mere sofistikerede rum, hvilket i sidste ende giver anledning til forestillinger som Fréchet eller Gateaux -derivatet . På samme måde i differentialgeometri er differentialet af en funktion på et punkt en lineær funktion af en tangensvektor (en "uendelig lille forskydning"), som viser den som en slags enform: funktionens ydre derivat . I ikke-standardregning betragtes differentialer som infinitesimals, som selv kan sættes på en streng fod (se differential (infinitesimal) ).

Definition

Differencen mellem en funktion ƒ ( x ) ved et punkt  x 0 .

Differencen er defineret i moderne behandlinger af differentialregning som følger. Differencen mellem en funktion f ( x ) i en enkelt reel variabel x er funktionen df af to uafhængige reelle variabler x og Δ x givet af

Et eller begge argumenter kan være undertrykt, dvs. man kan se df ( x ) eller simpelthen df . Hvis y  =  f ( x ), kan differencen også skrives som dy . Da dx ( x , Δ x ) = Δ x er det konventionelt at skrive dx  = Δ x , så følgende ligestilling holder:

Denne opfattelse af differential er stort set anvendelig, når der søges en lineær tilnærmelse til en funktion, hvor værdien af ​​forøgelsen Δ x er lille nok. Mere præcist, hvis f er en differentierbar funktion ved x , så er forskellen i y -værdier

tilfredsstiller

hvor fejlen ε i tilnærmelsen opfylder εx  → 0 som Δ x  → 0. Med andre ord har man den omtrentlige identitet

hvor fejlen kan gøres så lille som ønsket i forhold til Δ x ved at begrænse Δ x til at være tilstrækkelig lille; det vil sige,

som Δ x  → 0. Af denne grund er differentialet i en funktion kendt som hoveddelen (lineær) i forøgelsen af ​​en funktion: differencen er en lineær funktion af forøgelsen Δ x , og selvom fejlen ε kan være ikke -lineær, har den en tendens til hurtigt at nulstilles, da Δ x har en tendens til nul.

Differentialer i flere variabler

Operatør / funktion
Differentiale 1: 2:

3:

Delvist afledt
Total afledt

Efter Goursat (1904 , I, §15), for funktioner af mere end en uafhængig variabel,

den delvise differentialy med hensyn til en af ​​variablerne  x 1 er hoveddelen af ​​ændringen i y som følge af en ændring  dx 1 i den ene variabel. Den delvise forskel er derfor

der involverer det partielle derivat af y med hensyn til  x 1 . Summen af ​​de delvise forskelle med hensyn til alle de uafhængige variabler er den samlede differential

som er hoveddelen af ​​ændringen i y som følge af ændringer i de uafhængige variabler  x i .

Mere præcist, i forbindelse med multivariabel beregning, efter Courant (1937b) , hvis f er en differentierbar funktion, så er definitionen af ​​differentierbarhed , stigningen

hvor fejlbetegnelserne ε i har tendens til nul, da trinene Δ x i i fællesskab har en tendens til nul. Den samlede differential defineres derefter strengt som  

Da, med denne definition,

man har

Som i tilfælde af en variabel holder den omtrentlige identitet

hvor den samlede fejl kan laves så lille som ønsket i forhold til ved at begrænse opmærksomheden til tilstrækkeligt små trin.

Anvendelse af den samlede differential til fejlestimering

Ved måling bruges den samlede differential til at estimere fejlen Δ f for en funktion f baseret på fejlene Δ x , y y , ... for parametrene x , y ,…. Forudsat at intervallet er kort nok til at ændringen er tilnærmelsesvis lineær:

Δ f ( x ) = f ' ( x ) × Δ x

og at alle variabler er uafhængige, så for alle variabler,

Dette skyldes, at derivatet f x med hensyn til den særlige parameter x giver funktionens f følsomhed over for en ændring i x , især fejlen Δ x . Da de antages at være uafhængige, beskriver analysen det værst tænkelige scenario. De absolutte værdier af komponentfejlene bruges, fordi derivatet efter simpel beregning kan have et negativt tegn. Fra dette princip stammer fejlreglerne for summering, multiplikation osv., F.eks .:

Lad f ( a , b ) = a × b ;
A f = f a A a + f b A b ; evaluering af derivaterne
A f = b A a + a A b ; dividere med f , hvilket er a × b
Δ f / f = Δ a / a + Δ b / b

Det vil sige, i multiplikation er den samlede relative fejl summen af ​​de relative fejl i parametrene.

For at illustrere, hvordan dette afhænger af den betragtede funktion, skal du overveje det tilfælde, hvor funktionen er f ( a , b ) = a ln b i stedet. Derefter kan det beregnes, at fejlestimatet er

Δ f / f = Δ a / a + Δ b / ( b ln b )

med en ekstra ' ln b ' faktor, der ikke findes i tilfælde af et enkelt produkt. Denne yderligere faktor har en tendens til at gøre fejlen mindre, da ln b ikke er så stor som en bare  b .

Højere ordensforskelle

Højere ordensforskelle for en funktion y  =  f ( x ) for en enkelt variabel x kan defineres via:

og generelt

Uformelt motiverer dette Leibniz's notation for derivater af højere orden

Når den uafhængige variabel x selv får lov til at afhænge af andre variabler, bliver udtrykket mere kompliceret, da det også skal indeholde højere ordensforskelle i x selv. Således er f.eks.

og så videre.

Lignende overvejelser gælder for at definere højere ordensforskelle i funktioner af flere variabler. For eksempel, hvis f er en funktion af to variabler x og y , så

hvor er en binomial koefficient . I flere variabler holder et analogt udtryk, men med en passende multinomial ekspansion frem for binomial ekspansion.

Højere ordensforskelle i flere variabler bliver også mere komplicerede, når de uafhængige variabler selv får lov til at afhænge af andre variabler. For eksempel har man for en funktion f af x og y, som får lov til at afhænge af hjælpevariabler

På grund af denne teoretiske infelicitet blev brugen af ​​højere ordensforskelle kritiseret af Hadamard 1935 , der konkluderede:

Enfin, que signifie ou que représente l'égalité
A mon avis, rien du tout.

Det vil sige: Endelig, hvad menes eller repræsenteres af ligestillingen [...]? Efter min mening, slet ikke noget. På trods af denne skepsis opstod højere ordensforskelle som et vigtigt redskab i analysen.

I disse sammenhænge, den n te ordens differential af funktionen f påført en tilvækst Δ x er defineret ved

eller et tilsvarende udtryk, som f.eks

hvor er en n th forskel med stigning t Δ x .

Denne definition giver også mening, hvis f er en funktion af flere variabler (for enkelthed taget her som et vektorargument). Så er den n differential, der er defineret på denne måde, en homogen funktion af grad n i vektorforøgelsen Δ x . Desuden er Taylor -serien af f ved punktet x givet af

Den højere orden Gateaux -derivat generaliserer disse overvejelser til uendelige dimensionelle rum.

Ejendomme

Et antal egenskaber ved differentialet følger på en ligetil måde fra de tilsvarende egenskaber for derivatet, delderivatet og det totale derivat. Disse omfatter:

  • Linearitet : For konstanter a og b og differentierbare funktioner f og g ,

En operation d med disse to egenskaber kendes i abstrakt algebra som en afledning . De antyder magtreglen

Derudover holder forskellige former for kædereglen et stigende generelt niveau:

  • Hvis y  =  f ( u ) er en differentierbar funktion af variablen u og u  =  g ( x ) er en differentierbar funktion af x , så
Heuristisk kan kædereglen for flere variabler i sig selv forstås ved at dividere gennem begge sider af denne ligning med den uendeligt lille mængde dt .
  • Mere generelle analoge udtryk holder, hvor mellemvariablerne x i afhænger af mere end en variabel.

Generel formulering

En konsekvent opfattelse af differential kan udvikles for en funktion f  : R nR m mellem to euklidiske rum . Lad x , Δ x  ∈  R n være et par euklidiske vektorer . Forøgelsen i funktionen f er

Hvis der findes en m  ×  n matrix A, sådan at

hvor vektoren ε  → 0 som Δ x  → 0, så er f per definition differentierbar ved punktet x . Matrixen A er undertiden kendt som den Jacobianske matrix , og den lineære transformation, der associerer til stigningen Δ x  ∈  R n vektoren A Δ x  ∈  R m, er i denne generelle indstilling kendt som differentialet df ( x ) af f på punktet x . Dette er netop Fréchet -derivatet , og den samme konstruktion kan fås til at fungere til en funktion mellem alle Banach -rum .

Et andet frugtbart synspunkt er at definere differencen direkte som en slags retningsderivat :

som er den fremgangsmåde, der allerede er anvendt til at definere højere ordensforskelle (og er næsten den definition, der er angivet af Cauchy). Hvis t repræsenterer tid og x position, repræsenterer h en hastighed i stedet for en forskydning, som vi hidtil har betragtet den. Dette giver endnu en forfining af begrebet differential: at det skal være en lineær funktion af en kinematisk hastighed. Sættet af alle hastigheder gennem et givet rumpunkt er kendt som tangensrummet , og df giver derfor en lineær funktion på tangentrummet: en differentialform . Med denne fortolkning er differensen af f kendt som det udvendige derivat og har bred anvendelse i differentialgeometri, fordi begrebet hastigheder og tangensrum giver mening på enhver differentierbar manifold . Hvis udgangsværdien af f derudover også repræsenterer en position (i et euklidisk rum), bekræfter en dimensionsanalyse, at outputværdien af df skal være en hastighed. Hvis man behandler differentialet på denne måde, så er det kendt som skub fremad, da det "skubber" hastigheder fra et kilterum til hastigheder i et målrum.

Andre tilgange

Selvom forestillingen om at have en infinitesimal stigning dx ikke er veldefineret i moderne matematisk analyse , findes der en række forskellige teknikker til at definere den infinitesimale differential, så differentialet af en funktion kan håndteres på en måde, der ikke kolliderer med Leibniz-notationen . Disse omfatter:

Eksempler og applikationer

Differentialer kan effektivt bruges i numerisk analyse til at studere udbredelsen af ​​eksperimentelle fejl i en beregning og dermed den overordnede numeriske stabilitet af et problem ( Courant 1937a ). Antag, at variablen x repræsenterer resultatet af et eksperiment, og y er resultatet af en numerisk beregning anvendt på x . Spørgsmålet er i hvilket omfang fejl i måling af x påvirker resultatet af beregningen af y . Hvis x vides at ligge inden for Δ x af dets sande værdi, giver Taylors sætning følgende skøn over fejlen Δ y i beregningen af y :

hvor ξ = x + θ Δ x for nogle 0 < θ <1 . Hvis Δ x er lille, så er anden ordensbetegnelse ubetydelig, så Δ y er af praktiske formål godt tilnærmet af dy = f ' ( x ) Δ x .

Differencen er ofte nyttig til at omskrive en differentialligning

i formen

især når man vil adskille variablerne .

Noter

  1. ^ For en detaljeret historisk redegørelse for forskellen, se Boyer 1959 , især side 275 for Cauchys bidrag om emnet. En forkortet beretning vises i Kline 1972 , kapitel 40.
  2. ^ Cauchy benægtede eksplicit muligheden for faktiske uendelige og uendelige mængder ( Boyer 1959 , s. 273–275) og tog det radikalt forskellige synspunkt, at "en variabel størrelse bliver uendelig lille, når dens numeriske værdi falder på ubestemt tid på en sådan måde, at at konvergere til nul "( Cauchy 1823 , s. 12; oversættelse fra Boyer 1959 , s. 273).
  3. ^ Boyer 1959 , s. 275
  4. ^ Boyer 1959 , s. 12: "De således definerede forskelle er kun nye variabler og ikke faste uendelige tal ..."
  5. ^ Courant 1937a , II, §9: "Her bemærker vi bare forbifarten, at det er muligt at bruge denne omtrentlige repræsentation af forøgelsen Δ y ved det lineære udtryk hf ( x ) til at konstruere en logisk tilfredsstillende definition af en" differential ", som især blev gjort af Cauchy. "
  6. ^ Boyer 1959 , s. 284
  7. ^ Se f.eks. De indflydelsesrige afhandlinger fra Courant 1937a , Kline 1977 , Goursat 1904 og Hardy 1905 . Tertiære kilder til denne definition omfatter også Tolstov 2001 og Itô 1993 , §106.
  8. ^ Cauchy 1823 . Se også f.eks. Goursat 1904 , I, §14.
  9. ^ Goursat 1904 , I, §14
  10. ^ Især til uendelig dimensionel holomorfi ( Hille & Phillips 1974 ) og numerisk analyse via beregningen af endelige forskelle .
  11. ^ Goursat 1904 , I, §17
  12. ^ Goursat 1904 , I, §§14,16
  13. ^ Eisenbud & Harris 1998 .
  14. ^ Se Kock 2006 og Moerdijk & Reyes 1991 .
  15. ^ Se Robinson 1996 og Keisler 1986 .

Referencer

eksterne links