8.1 Differenzierbarkeit

In Kapitel 7 wurden zwei äquivalente Definitionen für die Differenzierbarkeit von Funktionen mit einer Veränderlichen angegeben. Wir werden jetzt die zweite der Definitionen, die die lineare Approximation benutzt, für Funktionen f : IRn IR bzw. f : IRn IRm mit mehreren Veränderlichen verallgemeinern. Hierzu machen wir zunächst einen kleinen Exkurs in die lineare Algebra.

Eine lineare Abbildung A : IRn IRm (IRn,IRm Vektorräume mit kanonischer Basis) kann als Matrix aufgefaßt werden:

     A = a11 a1n am1amn .

Die Elemente x̄ IRn, ȳ IRm sind dann sog. Spaltenvektoren:

     x̄ = x1 xn , ȳ = y1 ym ,

und es ist

     Ax̄ = a11 a1n am1amn x1 xn = i=1na 1ixi i=1na mixi := y1 ym IRm.

Ist m = 1, dann besteht die Matrix A nur aus einer Zeile, die dann als Vektor in IRn aufgefaßt werden kann. Hierfür wählen wir die Bezeichnung A := (a1,,an). In diesem Fall schreibt man (der Einfachheit wegen aus drucktechnischen Gründen) die Vektoren x̄ IRn als Zeilen : x̄ = (x1,,xn). Dann ist

     Ax̄ = (a1,,an) (x1,,xn) = i=1na ixi

das Skalarprodukt der beiden Vektoren.

Ist zusätzlich n = 1, also A : IR IR, dann besteht die Matrix (bzw. der Vektor) A nur aus einer Komponente : A = (a1). Wendet man A auf einen „Vektor“ x̄ = (x1) aus IR an, so erhält man Ax̄ = a1x1. Für A bzw. x̄ schreiben wir dann einfach a1 bzw. x1.

Diese Bezeichnungsweise ausnutzend liefert die zweite Definition der Differenzierbarkeit aus Kapitel 7, 7/1/10 folgende Formulierung:

 

f ist in c IR differenzierbar

f ist in einer Umgebung U(c) definiert, und es existiert eine lineare Abbildung b : IR IR und eine Funktion o(x) : IR IR mit o(x) |x - c|xc0, so daß für jedes x U(c) gilt: f(x) = f(c) + b (x - c) + o(x).

Diese Formulierung läßt sich sofort auf Funktionen f : IRn IRm und Elemente c̄ IRn erweitern.

Definition. (Differenzierbarkeit, Ableitung) Sei f : IRn IRm und c̄ IRn. f ist in c̄ differenzierbar (oder total differenzierbar) =Df

f ist in einer Umgebung U(c̄) definiert, und es existiert eine lineare Abbildung A : IRn IRm und eine Funktion o(x̄) : IRn IRm mit der Eigenschaft lim x ¯ c ¯ o( x ¯ ) | x ¯ c ¯ | = 0 ¯ , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaCbeaeaaci GGSbGaaiyAaiaac2gaaSqaamaanaaabaGaamiEaaaacqGHsgIRdaqd aaqaaiaadogaaaaabeaakmaalaaabaGaam4BamaabmaabaWaa0aaae aacaWG4baaaaGaayjkaiaawMcaaaqaamaaemaabaWaa0aaaeaacaWG 4baaaiabgkHiTmaanaaabaGaam4yaaaaaiaawEa7caGLiWoaaaGaey ypa0Zaa0aaaeaacaaIWaaaaiaabYcaaaa@492F@ so daß für jedes x̄ U(c̄) gilt: f(x̄) = f(c̄) + A (x̄ -c̄) + o(x̄).

Die Matrix A heißt dann 1. Ableitung von f an der Stelle c̄.      Bez.: A := f(c̄).

Als wichtigsten Spezialfall erhält man die Differenzierbarkeit bzw. die Ableitung einer Funktion f : IRn IR an der Stelle c̄ IRn. A besteht in diesem Falle nur aus einer Zeile. Die Ableitung f(c̄) ist dann ein Vektor (im allgemeinen ist f(c̄) eine Matrix). Dieser Vektor heißt auch Gradient von f an der Stelle c̄ (oder kurz in c̄).      Bez.: f(c̄) = gradf(c̄).

Das Wesen der Differenzierbarkeit besteht auch hier in der linearen Approximierbarkeit einer Funktion f in einer Umgebung U(c̄); d.h., f läßt sich in U(c̄) darstellen als f(c̄) + A(x̄ -c̄) plus einem Rest o(x̄), der in U(c̄) „klein“ ist, wobei hier ’klein’ bedeuten soll, daß lim x ¯ c ¯ o( x ¯ ) | x ¯ c ¯ | = 0 ¯  ( ρ m ). MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaCbeaeaaci GGSbGaaiyAaiaac2gaaSqaamaanaaabaGaamiEaaaacqGHsgIRdaqd aaqaaiaadogaaaaabeaakmaalaaabaGaam4BamaabmaabaWaa0aaae aacaWG4baaaaGaayjkaiaawMcaaaqaamaaemaabaWaa0aaaeaacaWG 4baaaiabgkHiTmaanaaabaGaam4yaaaaaiaawEa7caGLiWoaaaGaey ypa0Zaa0aaaeaacaaIWaaaaiaabccacaqGOaGaeyicI4SaeSyhHe6a aWbaaSqabeaaqaaaaaaaaaWdbiaad2gaaaGcpaGaaeykaiaab6caaa a@4F77@

Durch ȳ = A(x̄ -c̄) wird eine Punktmenge in IRn × IRm beschrieben. Die durch ȳ := t(x̄) = f(c̄) + A(x̄ -c̄) definierte Punktmenge heißt Tangentialebene von f an der Stelle c̄, und t(x̄) = f(c̄) + A(x̄ -c̄) heißt Gleichung der Tangentialebene.

Der Punkt (c̄,f(c̄)) erfüllt diese Gleichung, d.h., er liegt in der Tangentialebene.

Der Anteil A(x̄ -c̄) von der Funktion t(x̄) heißt Differential (oder 1. Differential) von f in c̄. Wir werden auf diese Begriffe noch einmal zurückkommen, insbesondere im Zusammenhang mit der Berechnung und Darstellung der Ableitung und damit auch der Tangentialebene und des Differentials.

Um die Analogie bei der Differenzierbarkeit von Funktionen einer und mehrerer Veränderlicher besser zu veranschaulichen, betrachten wir die folgenden beiden Spezialfälle.

Für n = m = 1 (also f : IR IR und c IR) definiert t(x) = f(c) + A:=b(x - c) eine Gerade in IR × IR = IR2, die Tangente von f an der Stelle c.

Für n = 2, m = 1 und c̄ IR2 wird durch t(x̄) = f(c̄) + A(x̄ -c̄) eine Ebene in IR2 × IR = IR3 bestimmt, die offenbar den Punkt (c̄,f(c̄)) enthält. In diesem Fall ist der Begriff „Tangentialebene“ wörtlich zu nehmen.

Wir haben bereits die Ableitung einer Funktion mit mehreren Veränderlichen definiert, wir haben aber noch kein praktikabeles Verfahren, um die Ableitung einer konkreten Funktion zu berechnen. Dazu betrachten wir zunächst Funktionen f : IRn IR und definieren den Begriff der partiellen Ableitbarkeit.

Definition. (partielle Ableitung) Sei f : IRn IR, c̄ IRn, x̄ = (x 1,,xn) und f in einer Umgebung U(c̄) definiert. f ist in c̄ partiell nach xi differenzierbar (i = 1,,n) =Df

Die Funktion φ(xi) := f(c1,,ci-1,xi,ci+1,,cn) ist (als Funktion der einen Veränderlichen xi) an der Stelle ci differenzierbar.

Nach der früheren Differenzierbarkeitsdefinition bedeutet dies, daß die folgenden Limites existieren:

      limxiciφ(xi) - φ(ci) xi - ci = limh0φ(ci + h) - φ(ci) h , für h := xi - ci

      = limxicif(ci,,ci-1,xi,ci+1,,cn) - f(c̄) xi - ci .

Der Limes selbst (falls er existiert) heißt partielle Ableitung von f nach xi an der Stelle c̄ (oder kurz: in c̄).      Bez.: f xi(c̄) = fxi(c̄).

Für h := xi - ci und ε¯i = (0,, 0, 1, 0,, 0) IRn, i = 1,,n, wobei die Eins in ε¯i an der i-ten Stelle steht, existieren die folgenden Limites:

     lim xiciφ(xi) - φ(ci) xi - ci = lim h0f(c̄ + h ε¯i) - f(c̄) h .

Beispiel. Sei f : IR2 IR, f(x,y) = x2y + 2y, c̄ = (a,b).

Dann ist

     f x(c̄) = lim xaf(x,b) - f(a,b) x - a = f(x,b)(a) = (2xb)(a) = 2ab.

Allgemein ist

     f x(x,y) := x(f(x,y)) = x(x2y + 2y) = 2xy.

Analog erhält man

     f y(x,y) = y(x2y + 2y) = x2 + 2 f y(c̄) = a2 + 2.

Die Abbildung 8.1 zeigt die geometrische Veranschaulichung der partiellen Ableitungen für eine Funktion mit zwei Veränderlichen.

PICT

Die partielle Ableitung nach xi gibt also den Anstieg der Tangente in Richtung der Achse xi an. Wir werden diese Art der Ableitung noch einmal verallgemeinern zur sog. Richtungsableitung. Dazu geben wir uns (durch einen geeigneten Vektor) eine beliebige Richtung vor und betrachten den Anstieg der Tangente in diese Richtung, falls die zugrundegelegte Funktion dies zuläßt. Daraus ergibt sich folgende Definition.

Definition. (Richtungsableitung) Es sei f : IRn IR, c̄ IRn und f in einer Umgebung U(c̄) definiert. Weiterhin sei r̄ IRn und |r̄| = 1. f ist an der Stelle c̄ in Richtung r̄ differenzierbar =Df

Die Funktion φ(h) := f(c̄ + h r̄) ist (als Funktion der einen Veränderlichen h) an der Stelle 0 differenzierbar; d.h., es existiert lim h0φ(h) - φ(0) h = lim h0f(c̄ + h r̄) - f(c̄) h .
Der Limes heißt dann Richtungsableitung von f an der Stelle c̄ in Richtung r̄.      Bez.: f r̄(c̄) = fr̄(c̄).

Bemerkung. (1) Der Vektor r̄, der die Richtung festlegt, wird stets mit der Länge 1 gewählt, damit die Richtungsableitung nur von der Richtung und nicht von der Länge des Vektors r̄ abhängt. (2) Wie auch bei Funktionen einer Veränderlichen können Ableitung, partielle Ableitungen und Richtungsableitungen einer Funktion f(x̄) in einer Menge M D(f) gebildet werden, wenn die entsprechenden Ableitungen in jedem Punkt der Menge existieren. Diese Ableitungen beschreiben neue in M definierte Funktionen, die wir der Reihe nach mit f, f xi := fxi, f r̄ := fr̄ bezeichnen.

Applet
Abb. 8.2 - dynamisch: Bewegen der Abbildung mit der Maus

PICT

Satz 8.1 Sei f : IRn IRm und c̄ IRn. Ist f in c̄ differenzierbar, dann ist f in c̄ stetig.

Beweis. Sei f in c̄ differenzierbar. Dann existiert eine Umgebung U(c̄), so daß für jedes x̄ U(c̄) gilt: f(x̄) - f(c̄) = A(x̄ -c̄) + o(x̄).

g.z.z:  lim x ¯ c ¯ ( f( x ¯ )f( c ¯ ) )= 0. ¯ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaae4zaiaab6 cacaqG6bGaaeOlaiaabQhacaqG6aGaaeiiamaaxababaGaciiBaiaa cMgacaGGTbaaleaadaqdaaqaaiaadIhaaaGaeyOKH46aa0aaaeaaca WGJbaaaaqabaGcdaqadaqaaiaadAgadaqadaqaamaanaaabaGaamiE aaaaaiaawIcacaGLPaaacqGHsislcaWGMbWaaeWaaeaadaqdaaqaai aadogaaaaacaGLOaGaayzkaaaacaGLOaGaayzkaaGaeyypa0Zaa0aa aeaacaaIWaGaaiOlaaaaaaa@4E8C@

Offenbar gilt o( x ¯ ) x ¯ c ¯ 0 ¯ . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaam4Bamaabm aabaWaa0aaaeaacaWG4baaaaGaayjkaiaawMcaamaaoGcaleqabaWa a0aaaeaacaWG4baaaiabgkziUoaanaaabaGaam4yaaaaaOGaayPKHa Waa0aaaeaacaaIWaaaaiaab6caaaa@408E@

Nach Satz 6.8 ist eine Vektorfunktion stetig, wenn alle ihre Komponenten stetig sind. Dies trifft insbesondere auf A(x̄ -c̄) zu. Die Komponenten sind aber als lineare Funktionen (nach Satz 6.11) stetig. Folglich gilt auch A( x ¯ c ¯ ) x ¯ c ¯ 0 ¯ . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamyqamaabm aabaWaa0aaaeaacaWG4baaaiabgkHiTmaanaaabaGaam4yaaaaaiaa wIcacaGLPaaadaGdOaWcbeqaamaanaaabaGaamiEaaaacqGHsislda qdaaqaaiaadogaaaaakiaawkziamaanaaabaGaaGimaaaacaqGUaaa aa@4146@ Hieraus folgt die Behauptung.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Aus der partiellen Differenzierbarkeit nach allen Variablen folgt im allgemeinen noch nicht die Stetigkeit, wie das folgende Beispiel zeigt.

Beispiel. Es sei f( x,y )={ 2xy x 2 + y 2 , falls ( x,y ) 0 ¯ , 0, falls ( x,y )= 0 ¯ . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaGaamiEaiaacYcacaWG5baacaGLOaGaayzkaaGaeyypa0Zaaiqa aeaafaqaaeGabaaabaWaaSaaaeaacaaIYaGaamiEaiaadMhaaeaaca WG4bWaaWbaaSqabeaaqaaaaaaaaaWdbiaaikdaaaGcpaGaey4kaSIa amyEamaaCaaaleqabaWdbiaaikdaaaaaaOWdaiaabYcacaqGGaGaae OzaiaabggacaqGSbGaaeiBaiaabohacaqGGaWaaeWaaeaacaWG4bGa aiilaiaadMhaaiaawIcacaGLPaaacqGHGjsUdaqdaaqaaiaaicdaaa GaaeilaaqaaiaaicdacaqGSaGaaeiiaiaabAgacaqGHbGaaeiBaiaa bYgacaqGZbGaaeiiamaabmaabaGaamiEaiaacYcacaWG5baacaGLOa GaayzkaaGaeyypa0Zaa0aaaeaacaaIWaaaaiaab6caaaaacaGL7baa aaa@612A@ an der Stelle (0, 0) nach x und y differenzierbar, denn es ist

     f(x, 0) - f(0, 0) x - 0 = 0 - 0 x = 0 f x(0 ̄) = 0

und

     f(0,y) - f(0, 0) y - 0 = 0 - 0 y = 0 f y(0 ̄) = 0.

Aber f ist in 0 ̄ nicht stetig, denn anderenfalls wäre lim (x,y)(0,0)f(x,y) = f(0, 0) = 0. Speziell für x = y, x0 und (x,y) (0, 0) gilt dann

     f( x,y )=f( x,x )= 2 x 2 x 2 + x 2 =1 0. MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaGaamiEaiaacYcacaWG5baacaGLOaGaayzkaaGaeyypa0JaamOz amaabmaabaGaamiEaiaacYcacaWG4baacaGLOaGaayzkaaGaeyypa0 ZaaSaaaeaacaaIYaGaamiEamaaCaaaleqabaaeaaaaaaaaa8qacaaI YaaaaaGcpaqaaiaadIhadaahaaWcbeqaa8qacaaIYaaaaOWdaiabgU caRiaadIhadaahaaWcbeqaa8qacaaIYaaaaaaak8aacqGH9aqpcaaI XaWaaqIaaeaacqGHsgIRaaGaaGimaiaab6caaaa@4F6D@ PICT   !

Applet
Abb. 8.3 - dynamisch: Bewegen der Abbildung mit der Maus

PICT

Die nächsten drei Sätze stellen wichtige Beziehungen zwischen partieller und totaler Differenzierbarkeit her.

Satz 8.2 Sei f : IRn IR und c̄ IRn. Ist f in einer Umgebung U(c̄) definiert und nach allen Variablen partiell differenzierbar und sind alle partiellen Ableitungen in c̄ stetig, dann ist f in c̄ (total) differenzierbar, und für jedes x̄ U(c̄) gilt f(x̄) = f(c̄) + i=1n f xi(c̄) (xi - ci) + o(x̄). (D.h., die lineare Abbildung A : IRn IR, die aufgrund der Differenzierbarkeit existiert, ist gegeben durch A = (a1,,an) = f x1(c̄),, f xn(c̄) und A(x̄ -c̄) = i=1n f xi(c̄) (xi - ci).)

Beweis. Wir betrachten hier nur den Spezialfall n = 3. Dazu sei x̄ = (x,y,z) und c̄ = (a,b,c) (den allgemeinen Fall beweist man analog). Mit Hilfe des 1. Mittelwertsatz der Differentialrechnung (leicht modifiziert) erhält man

     f(x̄) - f(c̄) = f(x,y,z) - f(a,b,c) =

     f(x,y,z) - f(a,y,z) + f(a,y,z) - f(a,b,z) + f(a,b,z) - f(a,b,c) =

     f x(a + ϑ1(x - a),y,z :=ū) (x - a) + f y(a,b + ϑ2(y - a),z :=v̄) (y - b) +

     f z(a,b,c + ϑ3(x - a) :=w̄) (z - c) =     (nach dem 1. Mittelwertsatz)

     f x(ū) (x - a) + f y(v̄) (y - b) + f z(w̄) (z - c) =

     f x(c̄) (x - a) + f y(c̄) (y - b) + f z(c̄) (z - c) +

     f x(ū) -f x(c̄) (x - a) + + f x(w̄) -f x(c̄) (z - c) :=r(x̄).

Folglich ist

     f(x̄) = f(c̄) + f x(c̄) (x - a) + + f z(c̄) (z - c) + r(x̄).

Behauptung: r( x ¯ ) | x ¯ c ¯ | x ¯ c ¯ 0. MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaaca WGYbWaaeWaaeaadaqdaaqaaiaadIhaaaaacaGLOaGaayzkaaaabaWa aqWaaeaadaqdaaqaaiaadIhaaaGaeyOeI0Yaa0aaaeaacaWGJbaaaa Gaay5bSlaawIa7aaaadaGdOaWcbeqaamaanaaabaGaamiEaaaacqGH sgIRdaqdaaqaaiaadogaaaaakiaawkziaiaaicdacaqGUaaaaa@46A6@

Nach Voraussetzung sind die partiellen Ableitungen in c̄ stetig, folglich gibt es für jedes ε > 0 ein δ > 0, so daß für jedes x̄ mit |x̄ -c̄| < δ gilt:

     f x(x̄) -f x(c̄) < ε 3,    (im allgemeinen Fall ist der Betrag < ε n).

Die obige Abschätzung gilt auch entsprechend für die partiellen Ableitungen nach y und nach z.

Offenbar gilt:

     |x̄ -c̄| < δ |ū -c̄|,,|w̄ -c̄| < δ,

denn 0 < ϑi < 1 für alle i.

Folglich ist erst recht

     f x(ū) -f x(c̄) < ε 3; analog für v̄ und w̄.

Damit ergibt sich folgende Abschätzung:

     |r(x̄)|f x(ū) -f x(c̄) <ε 3 |x - a||x̄-c̄| + + f z(w̄) -f z(c̄) <ε 3 |z - c||x̄-c̄|

        3 ε 3 |x̄ -c̄| = ε |x̄ -c̄|.

Also

     |r(x̄)| |x̄ -c̄| ε für 0 < |x̄ -c̄| < δ.

Hieraus folgt die Behauptung.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Ist f in einer Umgebung U(c̄) definiert und nach allen Variablen partiell differenzierbar und sind alle partiellen Ableitungen in c̄ stetig, dann läßt sich f(x̄) in U(c̄) durch die Funktion

     t(x̄) := f(c̄) + i=1n f xi(c̄) :=aiIR (xi - ci)

linear approximieren. Es gilt also f(x̄) = t(x̄) + o(x̄).

Satz 8.3 Sei f : IRn IR und c̄ IRn. Ist f in c̄ differenzierbar (d.h., es gibt reelle Zahlen a1,,an, so daß f(x̄) = f(c̄) + i=1na i(xi - ci) + o(x̄) für alle x̄ in einer Umgebung U(c̄)), dann existieren alle partiellen Ableitungen von f in c̄, und es ist ai = f xi(c̄). (Die Ableitung f(c̄) := (a 1,,an) ist also durch die partiellen Ableitungen eindeutig bestimmt.)

Beweis. Nach Voraussetzung gilt

     f(x̄) - f(c̄) = i=1na i(xi - ci) + o(x̄)

auch speziell für

     x̄ = (c1,,ci-1,xi,ci+1,,cn) = c̄ + hε¯i mit h = xi - ci.

Folglich ist

     f(x̄) - f(c̄) = f(c̄ + hε¯i) - f(c̄) = ai h + o(x̄)

     f(c̄ + hε¯i) - f(c̄) h = ai + o(x̄) h h00.

Damit existiert

     f xi(c̄) = lim h0f(c̄ + hε¯i) - f(c̄) h = ai.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Satz 8.4 Sei f : IRn IRm, f = (f 1,,fm) und c̄ IRn. Ist f in c̄ differenzierbar (d.h., es gibt eine lineare Abbildung A : IRn IRm, also eine (m × n)-Matrix A = (aji) i=1,n j=1,,m , so daß f(x̄) = f(c̄) + A(x̄ -c̄) + o(x̄) für alle x̄ in einer Umgebung U(c̄)), dann existieren alle partiellen Ableitungen fj xi (c̄), i = 1,,n, j = 1,,m, und es ist aji = fj xi (c̄). (Die Abbildung A ist also eindeutig bestimmt durch die partiellen Ableitungen fj xi (c̄).)

Beweis. Den Beweis führt man analog wie zum Satz 8.2.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Die Abbildung A : IRn IRm, also die 1. Ableitung der Vektorfunktion f, heißt auch Funktionalmatrix oder Jacobimatrix von f in c̄.      Bez.: f(c̄) = f1 x1(c̄) f1 xn(c̄) fm x1 (c̄)fm xn (c̄) := (f1,,fm) (x1,,xn) (c̄).

Ist m = 1, dann besteht die Matrix A = f(c̄) = f x1(c̄),, f xn(c̄) nur aus einer Zeile. In diesem Falle hat die 1. Ableitung oder der Gradient von f die Gestalt

     f(c̄) = gradf(c̄) = f x1,, f xn(c̄). Ist f in einer ganzen Umgebung U(c̄) differenzierbar, dann ist durch a¯f(a¯) für jedes a¯ U(c̄) eine Funktion f definiert. Diese Funktion bezeichnen wir mit

     f = f1 x1 f1 xn fm x1 fm xn = (f1,,fm) (x1,,xn) ;      für m = 1 ist f = f x1,, f xn = gradf. Für das Differential von f an der Stelle c̄ schreiben wir auch df(x̄,c̄) oder kurz df(x̄). Mit dieser Bezeichnung läßt sich die Tangentialebene folgendermaßen darstellen:

     t(x̄) = f(c̄) + df(x̄,c̄).

Wir werden jetzt noch gewisse Techniken im Umgang mit Differentialen entwickeln, die für manche Anwendungen sehr hilfreich sind. Dazu betrachten wir zunächst den eindimensionalen Fall f : IR IR und f(c) = df dx(c) = dy dx(c) für y = f(x). dy dx(c) gibt den Anstieg der Tangente von f in c an. Faßt man die Zahl f(c) als Bruch dy dx auf, dann erhält man dy = f(c)dx (dy hängt hierbei natürlich von c ab). Läßt man in der „Verhältniszahl“ f(c) = dy dx den „Nenner“ dx konstant, dann verändert sich mit c nur noch dy, d.h., dy ist dann eine Funktion von c. (vgl. Abb. 8.4)

PICT

Sei jetzt f : IRn IR. Manchmal schreibt man für xi - ci auch dxi und damit

     x̄ -c̄ = (x1 - c1,,xn - cn) = (dx1,,dxn) := dx̄.

Folglich erhält man

     df(x̄,c̄) = f(c̄) (x̄ -c̄) = f(c̄) dx̄ = i=1n f xi(c̄) dxi.

Betrachtet man die dxi als Konstante, dann hängt df(x̄,c̄) nur von c̄ ab. Damit ist das Differential für die Funktion f : IRn IR wieder eine Abbildung aus IRn in IR, df(c̄) : IRn IR. Die Ableitung f(c̄) (mit veränderlichem c̄) ist hingegen eine Vektorfunktion f(c̄) = f x1,, f xn(c̄) : IRn IRn. Die Ableitung von f (falls sie existiert) ist dann schon eine Matrix (Funktionalmatrix) usw. Die „Dimension“ der Ableitung wird also größer, die des Differentials nicht. Dies ist ein Vorteil, wenn man mit höheren Ableitungen bzw. Differentialen umgehen will.

Wir betrachten jetzt ein einfaches Beispiel für die Berechnung der Tangentialebene.

Beispiel. Es sei f(x,y) = x2 + y2. Gesucht ist die Gleichung der Tangentialebene von f an der Stelle c̄ = (1, 1). (vgl. Abb. 8.5; ein weiteres Beispiel für die Darstellung einer Funktion und der Tangentialebene an einer Stelle ist in den Abb. 8.6 a und 8.6 b gegeben.)

PICT

Es ist

     f(1, 1) = 2,

     f x(x,y) = 2x f x(1, 1) = 2,

     f y(x,y) = 2y f y(1, 1) = 2.

Folglich ist

     z = t(x,y) = f(1, 1) + f x(1, 1) (x - 1) + f x(1, 1) (y - 1)

          = 2 + 2(x - 1) + 2(y - 1).

Die Ebene geht durch die drei Punkte (1, 1, 2), (1, 0, 0), (0, 1, 0), wodurch die Ebene schon eindeutig bestimmt ist.

Applet
Abb. 8.6 - dynamisch: Bewegen der Abbildung mit der Maus


Abb. 8.6a


Abb. 8.6b

PICT

In dem folgenden Satz wird nachgewiesen, daß man aus der totalen Differenzierbarkeit die Richtungsableitbarkeit erhält und daß sich die Richtungsableitung mit Hilfe der partiellen Ableitungen berechnen läßt.

Satz 8.5 Sei f : IRn IR und c̄ IRn. Ist f in c̄ differenzierbar, dann ist f an der Stelle c̄ in jede Richtung r̄ (mit |r̄| = 1) differenzierbar, und es ist fr̄(c̄) = f(c̄) r̄ = i=1n f xi(c̄) ri, wobei r̄ = (r1,,rn).

Beweis. Nach Voraussetzung gilt für alle x̄ aus einer Umgebung U(c̄):

     f(x̄) = f(c̄) + f(c̄) (x̄ -c̄) + o(x̄)

Speziell für x̄ := c̄ + hr̄ U(c̄) erhält man dann

     f( c ¯ +h r ¯ )f( c ¯ )= f ( c ¯ )( c ¯ +h r ¯ c ¯ h r ¯ )+o( x ¯ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaWaa0aaaeaacaWGJbaaaiabgUcaRiaadIgadaqdaaqaaiaadkha aaaacaGLOaGaayzkaaGaeyOeI0IaamOzamaabmaabaWaa0aaaeaaca WGJbaaaaGaayjkaiaawMcaaiabg2da9iqadAgagaqbamaabmaabaWa a0aaaeaacaWGJbaaaaGaayjkaiaawMcaaabaaaaaaaaapeGaeyyXIC 9aaeWaaeaadaagaaqaamaanaaabaGaam4yaaaacqGHRaWkcaWGObWa a0aaaeaacaWGYbaaaiabgkHiTmaanaaabaGaam4yaaaaaSqaaiaadI gadaqdaaqaaiaadkhaaaaakiaawIJ=aaGaayjkaiaawMcaaiabgUca Riaad+gadaqadaqaamaanaaabaGaamiEaaaaaiaawIcacaGLPaaaaa a@571E@

und schließlich

     f(c̄ + hr̄) - f(c̄) h = f(c̄) r̄ + o(x̄) h 0.

Folglich ist

     lim h0f(c̄ + hr̄) - f(c̄) h = f(c̄) r̄.

Andererseits ist dieser Limes gleich fr̄(c̄). Hieraus folgt die Behauptung.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Wir befassen uns jetzt mit der Differenzierbarkeit zusammengesetzter Funktionen. Da sich die Ableitung einer Vektorfunktion auf die Ableitung ihrer reellwertigen Komponenten zurückführen läßt, werden wir uns im folgenden vorwiegend mit reellwertigen Funktionen befassen.

Satz 8.6 (Differentiation rationaler Funktionen) Seien f,g : IRn IR und f,g in c̄ differenzierbar. Dann gilt :   (1)

f ± g und f g sind in c̄ differenzierbar, und es ist (f ± g)(c̄) = f(c̄) ± g(c̄) d(f ± g) = df ± dg, (f g)(c̄) = f(c̄) g(c̄) + f(c̄) g(c̄) d(f g) = g df + f dg.
  (2)
Ist g(x̄)0 für jedes x̄ in einer Umgebung U(c̄), dann ist f g in c̄ differenzierbar, und es ist f g(c̄) = f(c̄) g(c̄) - f(c̄) g(c̄) g2(c̄) df g = g df - f dg g2 .

Beweis. Den Beweis führt man ähnlich wie für Funktionen einer reellen Veränderlichen; man hat hier lediglich alle Beweisschritte für die partiellen Ableitungen vorzunehmen.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Satz 8.7 (Spezialfall für die Kettenregel) Es sei g : IRn IR und f : IR IR (also f g : IRn IR). Ist g in c̄ und f in g(c̄) differenzierbar, dann ist f g in c̄ differenzierbar, und es ist (f g)(c̄) = f(g(c̄)) g(c̄).

Beweis. Sei b = g(c̄). Nach Voraussetzung ist g in c̄ und f in b = g(c̄) differenzierbar. Damit gilt:

     g(x̄) - g(c̄) = g(c̄) (x̄ -c̄) + o 1(x̄)

für alle x̄ in einer Umgebung U(c̄) und o 1 ( x ¯ ) | x ¯ c ¯ | x ¯ c ¯ 0 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaaca WGVbWaaSbaaSqaaabaaaaaaaaapeGaaGymaaWdaeqaaOWaaeWaaeaa daqdaaqaaiaadIhaaaaacaGLOaGaayzkaaaabaWaaqWaaeaadaqdaa qaaiaadIhaaaGaeyOeI0Yaa0aaaeaacaWGJbaaaaGaay5bSlaawIa7 aaaadaGdOaWcbeqaamaanaaabaGaamiEaaaacqGHsgIRdaqdaaqaai aadogaaaaakiaawkziaiaaicdaaaa@4712@ , und es ist

     f(y) - f(b) = f(b) (y - b) + o 2(y)

für alle y in einer Umgebung U(b) und o2(y) |y - b|yb0.

Da g in c̄ differenzierbar, also dort auch stetig ist, gilt für x̄ c̄ auch g(x̄) g(c̄). Nach Voraussetzung strebt o2(y) für y b von höherer als 1. Ordnung gegen null, d.h., es gibt eine Funktion r(y), so daß o2(y) = r(y) (y - b) und r(y)yb0.

Wir wählen jetzt y := g(x̄). Damit erhält man insgesamt

     (f g)(x̄) - (f g)(c̄) = f(g(x̄) =y) - f(g(c̄) =b) =

     f(g(c̄)) (g(x̄) - g(c̄)) + o 2(g(x̄)) =

     f(g(c̄)) g(c̄) (x̄ -c̄) + o 1(x) + o2(g(x̄)) =

     f(g(c̄)) g(c̄) (x̄ -c̄) + f(g(x̄)) o 1(x) + o2(g(x̄)) :=o(x̄).

Es bleibt zu zeigen, daß

     o( x ¯ ) | x ¯ c ¯ | x ¯ c ¯ 0. MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaaca WGVbWaaeWaaeaadaqdaaqaaiaadIhaaaaacaGLOaGaayzkaaaabaWa aqWaaeaadaqdaaqaaiaadIhaaaGaeyOeI0Yaa0aaaeaacaWGJbaaaa Gaay5bSlaawIa7aaaadaGdOaWcbeqaamaanaaabaGaamiEaaaacqGH sgIRdaqdaaqaaiaadogaaaaakiaawkziaiaaicdacaqGUaaaaa@46A2@

f(g(c̄)) ist konstant, folglich gilt f ( g( c ¯ ) ) o 1 ( x ¯ ) | x ¯ c ¯ | x ¯ c ¯ 0. MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabmOzayaafa WaaeWaaeaacaWGNbWaaeWaaeaadaqdaaqaaiaadogaaaaacaGLOaGa ayzkaaaacaGLOaGaayzkaaaeaaaaaaaaa8qacqGHflY1daWcaaqaai aad+gapaWaaSbaaSqaa8qacaaIXaaapaqabaGcdaqadaqaamaanaaa baGaamiEaaaaaiaawIcacaGLPaaaa8qabaWaaqWaaeaadaqdaaqaai aadIhaaaGaeyOeI0Yaa0aaaeaacaWGJbaaaaGaay5bSlaawIa7aaaa daGdOaWcbeqaamaanaaabaGaamiEaaaacqGHsgIRdaqdaaqaaiaado gaaaaakiaawkziaiaaicdacaqGUaaaaa@502A@

Weiterhin ist

     |o2(g(x̄))| |x̄ -c̄| = |r(g(x̄)) (g(x̄) - g(c̄))| |x̄ -c̄|

          = |r(g(x̄))||g(x̄) - g(c̄)| |x̄ -c̄| = |r(g(x̄))||g(c̄) (x̄ -c̄) + o1(x̄)| |x̄ -c̄|

          |r(g(x̄))||g(c̄)||x̄ -c̄| |x̄ -c̄| + |o1(x̄)| |x̄ -c̄|

          =| r( g( x ¯ ) ) |( | g ( c ¯ ) | konstant + | o 1 ( x ¯ ) | | x ¯ c ¯ | x ¯ c ¯ 0 ) x ¯ c ¯ 0. MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeyypa0Zaaq WaaeaacaWGYbWaaeWaaeaacaWGNbWaaeWaaeaadaqdaaqaaiaadIha aaaacaGLOaGaayzkaaaacaGLOaGaayzkaaaacaGLhWUaayjcSdaeaa aaaaaaa8qacqGHflY1daqadaqaamaayaaabaWaaqWaaeaaceWGNbGb auaadaqadaqaamaanaaabaGaam4yaaaaaiaawIcacaGLPaaaaiaawE a7caGLiWoaaSqaaiaabUgacaqGVbGaaeOBaiaabohacaqG0bGaaeyy aiaab6gacaqG0baakiaawIJ=aiabgUcaRmaayaaabaWaaSaaaeaada abdaqaaiaad+gapaWaaSbaaSqaa8qacaaIXaaapaqabaGcdaqadaqa amaanaaabaGaamiEaaaaaiaawIcacaGLPaaaa8qacaGLhWUaayjcSd aabaWaaqWaaeaadaqdaaqaaiaadIhaaaGaeyOeI0Yaa0aaaeaacaWG JbaaaaGaay5bSlaawIa7aaaaaSqaamaaoGcameqabaWaa0aaaeaaca WG4baaaiabgkziUoaanaaabaGaam4yaaaaaSGaayPKHaGaaGimaaGc caGL44paaiaawIcacaGLPaaadaGdOaWcbeqaamaanaaabaGaamiEaa aacqGHsgIRdaqdaaqaaiaadogaaaaakiaawkziaiaaicdacaqGUaaa aa@7266@

Damit ist f g in U(c̄) durch

     t(x̄) := (f g)(c̄) + f(g(c̄)) IR g(c̄) IRn (x̄ -c̄)

linear approximiert, folglich ist

     (f g)(c̄) = f(g(c̄)) g(c̄).   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Satz 8.8 (Kettenregel) Es sei g : IRn IRm und f : IRm IRk (also f g : IRn IRk). Ist g in c̄ und f in g(c̄) differenzierbar, dann ist f g in c̄ differenzierbar, und es ist (f g)(c̄) = f(g(c̄)) g(c̄). (Das Produkt der „inneren“ und der äußeren“ Ableitung ist ein Produkt von Matritzen.)

Beweis. Die grundlegende Beweisidee ist die gleiche wie im vorhergehenden Satz. Da der technische Aufwand jedoch wesentlich größer ist, kann hier nur auf die Literatur verwiesen werden. (vgl. z.B. Literaturangabe [4], Teil II, Seite 217)   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Für g : IRn IRm und f : IRm IRk stellt sich die Ableitung von (f g) an der Stelle c̄ wie folgt dar, wobei b¯ = g(c̄) ist:

     (f g)(c̄) = f(g(c̄)) g(c̄) = f(b¯) g(c̄) = (f1,,fk) (y1,,ym)(b¯) (g1,,gm) (x1,,xn) (c̄)

          = f1 y1 (b¯) f1 ym(b¯) fk y1 (b¯)fk ym(b¯) g1 x1(c̄) g1 xn(c̄) gm x1 (c̄)gm xn (c̄)

          = ajii=1,,n j=1,,k und aji = ν=1mfj yν(b¯) gν xi (c̄).

Beispiele.

(1) Spezialfall einer Verkettung

Sei g : IR IR2 und f : IR2 IR, also f g : IR IR, wobei g := (g1,g2). Speziell sei g1(t) := t, g2(t) := t2, also g(t) = (g1(t),g2(t)) = (t,t2) ( IR2) und f(x,y) := sin(x y). Für x = g1(t) und y = g2(t) erhält man

     (f g)(t) = f(g(t)) = f(g1(t),g2(t)) = sin(t t2) = sin t3.

Offenbar ist f g eine reellwertige Funktion einer reellen Veränderlichen, folglich läßt sich die Ableitung nach den Regeln für Funktionen einer Veränderlichen bilden:

     (f g)(t) = (cos t3) 3t2.

Wir werden jetzt die Ableitung nach den Regeln für Funktionen mehrerer Veränderlicher berechnen; es wird sich zeigen, daß das gleiche Ergebnis entsteht. Es ist

     f(x,y) = f x(x,y), f y(x,y),

     g(t) = g1 t (t) g2 t (t) .

Folglich ist

     (f g)(t) = f(g(t)) g(t) = f x(g(t)), f y(g(t)) g1 t (t) g2 t (t) =

     f x(g(t)) g1 t (t) + f y(g(t)) g2 t (t) := ().

Es ist

     f x(x,y) = cos(xy) y f x(g(t)) = cos g1(t) g2(t) g2(t) = (cos t3) t2,

     f y(x,y) = cos(xy) x f y(g(t)) = cos g1(t) g2(t) g1(t) = (cos t3) t,

     g1 t (t) = 1 und g2 t (t) = 2t.

Dann ist

     (f g)(t) = () = (cos t3) t2 1 + (cost3) t 2t = (cos t3) 3t2.

(2) Transformation in Polarkoordinaten

Bei der Lösung mathematischer Probleme, insbesondere in der Physik, der Technik und den Naturwissenschaften überhaupt, ist es oft vorteilhaft, die zu behandelnden Probleme mit Hilfe besonders geeigneter Koordinatensysteme zu beschreiben oder vom kartesischen Koordinatensystem zu einem anderen überzugehen. Da dieser Übergang häufig mit der Verkettung von Funktionen und die Lösung der anstehenden Probleme oft mit der Differenzierbarkeit der Verkettung verbunden ist, wollen wir hier einige wichtige nicht-kartesische Koordinatensysteme behandeln. Zunächst betrachten wir die sog. Polarkoordinaten, die schon bei der Behandlung der trigonometrischen Funktionen in Kapitel 5 (vgl. Abb. 5.21) eine gewisse Rolle spielten.

Es sei P = (a,b)(0, 0) ein Punkt in der euklidischen Ebene, die mit einem kartesischen Koordinatensystem versehen ist, dessen Achsen mit x bzw. y bezeichnet werden. Offenbar läßt sich der Punkt (a,b) auch eindeutig durch das Paar (r,φ) beschreiben, wobei r der Abstand von (a,b) zum Nullpunkt ist und φ den Winkel zwischen der x-Achse und der Verbindungsstrecke von (0, 0) nach (a,b) angibt (φ in Bogenmaß gemessen). Damit ist der gleiche Punkt P in der Ebene IR2 durch unterschiedliche Koordinatensysteme eindeutig beschrieben worden (vgl. Abb. 8.7). a,b sind die kartesischen Koordinaten von P, und r,φ heißen Polarkoordinaten. (Der Nullpunkt ist mit Hilfe der Polarkoordinaten nicht eindeutig darstellbar, da der Winkel φ hierfür beliebig sein könnte.)

PICT

Nach Voraussetzung gilt also

     a = r cos φ := g1(r,φ)

und

     b = r sin φ := g2(r,φ).

Betrachtet man den Punkt P als variabel, (a,b) := (x,y), dann erhält man eine Abbildung

     g(r,φ) := (g1(r,φ),g2(r,φ)) = (x,y),

also

     g : IR2 IR2 mit 0 φ < 2π und 0 r < .

Wir betrachten jetzt ein Beispiel einer Funktion in kartesischen Koordinaten und in Polarkoordinaten.

Sei f : IR2 IR und f(x,y) = x2 + y2, wobei der Definitionsbereich von f ein Kreis mit dem Mittelpunkt (0, 0) und dem Radius R sein soll, also D(f) := {(x,y) : x2 + y2 R2}.

Wir stellen jetzt f in Polarkoordinaten dar. Für

     f(x,y) = x2 + y2

und

     x = r cos φ := g1(r,φ), y = r sin φ := g2(r,φ)

ist

     f(x,y) = f(g1(r,φ),g2(r,φ)) = g1(r,φ)2 + g 2(r,φ)2 =

     r2 cos 2φ + r2 sin 2φ = r2(cos 2φ + sin 2φ =1) = r2.

 
Abb. 8.8a


Abb. 8.8b

PICT

Insgesamt haben wir

     g : IR2 IR2, f : IR2 IR f g : IR2 IR.

Also

     (f g)(r,φ) = f(g(r,φ)) = f(g1(r,φ),g2(r,φ)) = r2.

Die Ableitung der verketteten Funktion ergibt sich wie folgt:

     (f g)(r,φ) = f(g(r,φ)) g(r,φ),

     f(x,y) = f x, f y(x,y) = (2x, 2y),

     g(r,φ) = g1 r g1 φ g2 r g2 φ (r,φ) = cos φ-r sin φ sin φr cos φ .

Folglich gilt

     (f g)(r,φ) = f(g(r,φ)) g(r,φ) =

     (2r cos φ, 2r sin φ) cos φ-r sin φ sin φr cos φ =

     (2r cos φ cos φ + 2r sin φ sin φ,-2r sin φ r sin φ + 2r sin φ r cos φ) =

     (2r, 0).

Wir berechnen jetzt die Determinante der Funktionalmatrix von g(r,φ).

     det (g1,g2) (r,φ) (r,φ) = cos φ-r sin φ sin φr cos φ = r.

Bemerkung. (ohne Beweis) Sei g : IRn IRn, c̄ IRn, g(x̄) = g(x 1,,xn), und g := (g1,,gn).

Ist die Determinante der Funktionalmatrix von g in einer Umgebung U(c̄) von null verschieden, also

     det (g1,,gn) (x1,,xn)(x̄) 0 für alle x̄ U(c̄),

dann besitzt g in U(c̄) eine Umkehrfunktion.

Speziell für unsere Transformationsfunktion g : IR2 IR2 gilt dann

     det (g1,g2) (r,φ) (r,φ) 0 r0.

Die Koordinatentransformation ist demnach außer im Punkt (0, 0) injektiv.

(3) Transformation in Zylinderkoordinaten

Analog wie im Beispiel (2) werden jetzt räumliche Koordinaten transformiert.

Dazu sei P = (a,b,c)(0, 0, 0) ein Punkt im Raum IR3, der mit einem kartesischen Koordinatensystem versehen ist, dessen Achsen mit x, y bzw. z bezeichnet werden. Dann ist der Punkt (a,b,c) eindeutig durch das Tripel (r,φ,c) darstellbar, wobei r und φ die Polarkoordinaten des Punktes (a,b) in der Ebene IR2 sind und c bei der Transformation unverändert bleibt.

Damit ist der gleiche Punkt P im Raum IR3 durch unterschiedliche Koordinatensysteme eindeutig beschrieben worden (vgl. Abb. 8.9). Die neuen Koordinaten heißen Zylinderkoordinaten. (Der Nullpunkt ist analog wie im vorhergehenden Beispiel mit Hilfe der Zylinderkoordinaten nicht eindeutig darstellbar.)

PICT

Es gilt also

     a = r cos φ := g1(r,φ,z),

     b = r sin φ := g2(r,φ,z),

     c = c.

Betrachtet man den Punkt P als variabel, (a,b,c) := (x,y,z), dann erhält man eine Abbildung

     g(r,φ,z) := g1(r,φ,z),g2(r,φ,z),g3(r,φ,z) = (x,y,z),

also

     g : IR3 IR3 mit 0 φ < 2π, 0 r < und z IR.

Die Ableitung der Funktion g ergibt sich wie folgt:

     g(r,φ,z) = (g1,g2,g3) (r,φ,z) (r,φ,z) = cos φ-r sin φ0 sin φr cos φ 0 0 0 1 .

Damit ist

     det (g1,g2,g3) (r,φ,z) (r,φ,z) = r.

Für r0 ist die Transformation injektiv.

(4) Transformation in Kugelkoordinaten (oder sphärische Koordinaten)

Wir transformieren hierbei wieder räumliche Koordinaten. Dazu sei P = (a,b,c)(0, 0, 0) := 0 ̄ ein Punkt in dem Raum IR3, der mit dem kartesischen Koordinatensystem aus Beispiel (3) versehen ist. Der Punkt (a,b,c) wird erneut durch ein Koordinatentripel (r,φ,ϑ) beschrieben, deren Bedeutung aus der Abbildung 8.10 hervorgeht.

r gibt den Abstand zwischen 0 ̄ und P an. P := (a,b, 0) ist die Projektion von P auf die (x,y)-Ebene, und φ bezeichnet den Winkel, der durch die x-Achse und die Verbindungsstrecke zwischen den Punkten 0 ̄ und P aufgespannt wird.

Offenbar ist dann

     c = r sin ϑ und r = r cos ϑ, wobei -π 2 ϑ π 2.

Folglich ist

     a = r cos φ = r cos φ cos ϑ := g 1(r,φ,ϑ),

     b = r sin φ = r sin φ cos ϑ := g 2(r,φ,ϑ),

     c = r sin ϑ := g3(r,φ,ϑ).

Die neuen Koordinaten r, φ, ϑ heißen Kugelkoordinaten oder auch sphärische Koordinaten. (Die Punkte auf der z-Achse sind analog wie im vorhergehenden Beispiel mit Hilfe der Kugelkoordinaten nicht eindeutig darstellbar.)

PICT

Betrachtet man den Punkt P als variabel, (a,b,c) := (x,y,z), dann erhält man eine Abbildung

     g(r,φ,ϑ) := g1(r,φ,ϑ),g2(r,φ,ϑ),g3(r,φ,ϑ) = (x,y,z),

also

     g : IR3 IR3 mit 0 φ < 2π, 0 r < und -π 2 ϑ π 2.

Die Ableitung der Funktion g ergibt sich wie folgt:

     g(r,φ,ϑ) = (g1,g2,g3) (r,φ,ϑ) (r,φ,ϑ) = g1 r g1 φ g1 ϑ g2 r g2 φ g2 ϑ g3 r g3 φ g3 ϑ (r,φ,ϑ) =

     cos φ cos ϑ-r sin φ cos ϑ-r cos φ sin ϑ sin φ cos ϑr cos φ cos ϑ-r sin φ sin ϑ sin ϑ 0 r cos ϑ .

Damit ist

     det (g1,g2,g3) (r,φ,ϑ) (r,φ,ϑ) = r2 cos ϑ,

also

     det (g1,g2,g3) (r,φ,ϑ) (r,φ,ϑ) 0 r0undϑ ±π 2.

Für alle Punkte, die nicht auf der z-Achse liegen, ist die Transformation injektiv.

8.2 Partielle Ableitungen und Differentiale höherer Ordnung

Es sei f(x̄) : IRn IR in einer Umgebung eines Punktes nach allen Variablen partiell differenzierbar. Dann entstehen offenbar beim partiellen Differenzieren neue Funktionen f xi(x̄) := f(x̄) xi , i = 1,,n, die ebenfalls von x̄ abhängen. Diese partiellen Ableitungen können wieder nach gewissen Variablen partiell differenzierbar sein, etwa nach der Variablen xj.

Bildet man xjf(x̄) xi , dann erhält man die 2. partielle Ableitung von f nach xi und xj in x̄.      Bez.: xjf(x̄) xi := 2f(x̄) xixj = fxixj(x̄)

Für i = j schreibt man xjf(x̄) xi := 2f(x̄) xi2 = fxixi(x̄).

Ist ij, dann nennt man die 2. partiellen Ableitungen auch gemischte partielle Ableitungen.

Nach dem gleichen Muster definiert man induktiv die n-ten partiellen Ableitungen. Hierfür benutzt man die Bezeichnung

     nf(x̄) xi1xin = fxi 1xin(x̄), wobei i1,,in {1,,n}.

Satz 8.9 (Satz von Schwarz) Es sei f(x,y) : IR2 IR und c̄ IR2. Ist f in einer Umgebung U(c̄) definiert und existieren in U(c̄) die partiellen Ableitungen fx,fy,fxy und ist fxy in c̄ stetig, dann existiert auch fyx in c̄, und es ist fxy(c̄) = fyx(c̄). (Unter den angegebenen Bedingungen sind die gemischten Ableitungen in c̄ gleich.)

Beweis. Es sei c̄ = (a,b) und x̄ = (x,y).

Wir zeigen, daß fyx(a,b) = lim xafy(x,b) - fy(a,b) x - a existiert und gleich fxy(a,b) ist.

Nach Voraussetzung ist f in U(c̄) partiell nach x differenzierbar. Folglich läßt sich auf f (bei festgehaltenem y) der 1. Mittelwertsatz der Differentialrechnung bezüglich x anwenden. Damit erhält man für alle (x,y) U(c̄) und xa, yb :

1 x - afy(x,b) - fy(a,b)

= 1 x - a lim yb 1 y - bf(x,y) - f(x,b) :=g(x,y) - lim yb 1 y - bf(a,y) - f(a,b) =g(a,y)

= 1 x - a lim yb 1 y - bg(x,y) - g(a,y)

= lim yb 1 y - b g(x,y) - g(a,y) x - a

= lim yb 1 y - b gx(a + ϑ(x - a) :=u,y) (1. Mittelwertsatz, y fest, 0 < ϑ < 1)

= lim yb 1 y - b fx(u,y) - fx(u,b)

= fxy(u,b). (fxy existiert in U(c̄))

Da nach Voraussetzung fxy in c̄ stetig ist, existieren die folgenden Limites und es gilt:

     fyx(a,b) = lim xa 1 x - a fy(x,b) - fy(a,b) = lim xafxy(u,b) = fxy(a,b).   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Ist f(x1,,xn) : IRn IR und c̄ IRn und existieren in einer Umgebung U(c̄) die partiellen Ableitungen fxi,fxj und fxixj und ist fxixj in c̄ stetig, dann existiert auch fxjxi in c̄, und es ist fxixj(c̄) = fxjxi(c̄).

Den Beweis hierzu führt man leicht auf den vorhergehenden Satz zurück.

Wir befassen uns jetzt mit Differentialen höherer Ordnung. Dazu sei f(x̄) : IRn IR. Das 1. Differential wurde als Funktion df : IRn IR definiert, die sich darstellen läßt in der Form

     df := f x1 dx1 + + f xn dxn = f x1dx1 + + f xndxn,

wobei die dxi als konstant anzusehen sind.

Wir berechnen (definieren) jetzt das 2. Differential von f wie folgt.

   d2f := d(df) = d f x1dx1 + + f xndxn

     = d f x1dx1 + + d f xndxn   (dxi konstant !)

     = x1 f x1dx1 + + xn f x1dxndx1 +

      + x1 f xndx1 + + xn f xndxndxn

     = x1 f x1dx1dx1 + + xn f x1dxndx1 +

      + x1 f xndx1dx1 + + xn f xndxndxn

     = 2f x1x1dx1dx1 + + 2f x1xndxndx1 +

      + 2f xnx1dx1dxn + + 2f xnxndxndxn

     = 2f x12dx12 + + 2f xixjdxjdxi + + 2f xjxidxidxj + + 2f xn2dxn2 (ij).

Sind die gemischten Ableitungen gleich, dann gilt

     d2f = i=1n 2f xi2dxi2 + 2 i,j=1 i<j n 2f xixidxjdxj.

Analog definiert man induktiv

     dn+1f := d(dnf).

(Hierbei ist der Satz von Schwarz sehr nützlich.)

Beispiel.

Sei f(x,y) = x2 + y2. Dann ist

     f x = 2x, f y = 2y und 2f x2 = 2, 2f xy = 0, 2f yx = 0, 2f y2 = 2.

Folglich ist

     df = f xdx + f ydy = 2xdx + 2ydy.

Weiterhin ist

     d2f = d(df) = 2f x2dx2 + 2 2f xydxdy + 2f y2 dy2 =

        2dx2 + 2dy2,

und schließlich

     d3f = 0, (denn alle dritten partiellen Ableitungen sind null).

8.3 Der Satz von Taylor; lokale Extrema für Funktionen mit mehreren Veränderlichen

Wir werden jetzt einige Ergebnisse aus der Differentialrechnung für Funktionen mit einer Veränderlichen auf Funktionen mit mehreren Veränderlichen erweitern. Wir beginnen zunächst mit dem Mittelwertsatz, der sich auch hier als Spezialfall des Taylorschen Satzes erweist.

Satz 8.10 (Mittelwertsatz der Differentialrechnung mit mehreren Veränderlichen) Sei M IRn offen und f : IRn IR eine in M differenzierbare Funktion. Weiterhin seien a¯,b¯ M und die Verbindungsstrecke s(a¯,b¯) zwischen a¯ und b¯ gehöre zu M. Dann gibt es ein c̄ s(a¯,b¯) mit c̄a¯,b¯, so daß f(b¯) - f(a¯) = f(c̄)(b¯ -a¯).

Beweis. Wir betrachten zunächst eine Parameterdarstellung

     g(t) := b¯ + t(b¯ -a¯), t [0, 1]

von s(a¯,b¯) und definieren damit die Funktion F : [0, 1] IR mit der Eigenschaft

     F(t) := f(g(t)).

Offenbar ist F in [0, 1] stetig und in (0, 1) differenzierbar. Dann läßt sich auf F der 1. Mittelwertsatz der Differentialrechnung anwenden. Folglich existiert ein ξ (0, 1), so daß

     F(ξ) = F(1) - F(0) 1 - 0 = F(1) - F(0).

Hieraus folgt

     F(1) - F(0) = f(g(1) =b¯) - f(g(0) =a¯) = f(b¯) - f(a¯)

      = F(ξ) = f(g(ξ) :=c̄)g(ξ) =b¯-a¯

      = f(c̄)(b¯ -a¯).   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Bemerkung. Für Vektorfunktionen ist der Mittelwertsatz im allgemeinen falsch. Man betrachte das Beispiel f : [0, 1] IR2 mit f(x) = (x2,x3).

Offenbar gibt es kein c (0, 1), so daß f(1) - f(0) = f(c)(1 - 0) = (2c, 3c2).

Definition. (polygonzusammenhängend; Gebiet) Sei M IRn.

(1) M ist polygonzusammenhängend   =Df

Zu je zwei Punkten a¯,b¯ M gibt es endlich viele Elemente a¯0 = a¯,a¯1,,a¯m+1 = b¯, so daß die Verbindungsstrecken s(a¯i,a¯i+1) zwischen a¯i und a¯i+1, i = 1,,m, stets zu M gehören. (Da durch Polygonzüge stetige Funktionen gegeben sind, sind polygonzusammenhängende Mengen auch bogenzusammenhängend.)

(2) M ist ein Gebiet   =Df M ist polygonzusammenhängend und offen.

Satz 8.11 Sei M IRn ein Gebiet und f : M IR in M differenzierbar. Dann gilt : f ist konstant in M f(x̄) = 0 für alle x̄ M.

Beweis. () trivial, da die partiellen Ableitungen von konstanten Funktionen null sind.

() Es sei f(x̄) = 0 für jedes x̄ M und es seien a¯,b¯ M. Dann gibt es nach Voraussetzung Elemente a¯0 = a¯,a¯1,,a¯m+1 = b¯ in M, so daß s(a¯i,a¯i+1) M für i = 0,,m.

Nach dem Mittelwertsatz existiert stets ein c̄i s(a¯i,a¯i+1) mit c̄ia¯i,a¯i+1, so daß

     f(a¯i+1) - f(a¯i) = f(c̄ i) =0 (a¯i+1 -a¯i) = 0,

also ist f(a¯i+1) = f(a¯i) für alle i und damit f(a¯) = f(b¯) für beliebige a¯,b¯ M.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Beispiel. Es sei f : IR2 IR, wobei

     f(x,y) = arctan x y + arctan y x und D(f) = {(x,y) : x0, y0}.

Folglich ist f in den Gebieten

     M1 := {(x,y) : x > 0, y > 0},

     M2 := {(x,y) : x > 0, y < 0},

     M3 := {(x,y) : x < 0, y > 0},

     M4 := {(x,y) : x < 0, y < 0}

definiert und offenbar differenzierbar. In jedem der Gebiete gilt:

     f(x,y) x = 1 1 + x y2 1 y + 1 1 + y x2 - y x2

      = y2 (y2 + x2)y - x2y (x2 + y2)x2 = 0.

     f(x,y) y = 1 1 + x y2 - x y2 + 1 1 + y x2 1 x = 0.

Folglich ist f(x̄) = 0, und damit ist f in jedem der Mi konstant. Die Werte von f kann man leicht durch geeignete spezielle Argumente ermitteln.

In M1 ist f(x,y) = f(1, 1) = 2 arctan 1 = π 2 ,

in M2 ist f(x,y) = f(1,-1) = 2 arctan(-1) = -π 2 ,

in M3 ist f(x,y) = f(-1, 1) = 2 arctan(-1) = -π 2 ,

in M4 ist f(x,y) = f(-1,-1) = 2 arctan 1 = π 2 .

Es soll jetzt der Taylorsche Satz für Funktionen mit mehreren Veränderlichen verallgemeinert werden. Dies erfordert einen gewissen technischen Aufwand, den wir durch eine geeignete Schreibweise etwas reduzieren wollen.

Definition. Es sei M IRn und f : IRn IR in M definiert.

(1) f heißt in M stetig differenzierbar =Df

f ist in M differenzierbar und f ist in M stetig. (Dies ist nach dem Satz 8.2 genau dann der Fall, wenn alle partiellen Ableitungen von f in M vorhanden und stetig sind.)

(2) f ist in M (k + 1)-mal stetig differenzierbar =Df

f(k) ist in M stetig differenzierbar.    Bez.: f Ck+1(M).

Es sei jetzt M eine offene Teilmenge von IR2, f : IR2 IR und f Ck+1(M). Weiterhin seien a¯ = (a1,a2), c̄ = a¯ + th̄, wobei t [0, 1], h̄ = (h1,h2) und die Verbindungsstrecke s(a¯,b¯) ganz zu M gehöre. Dann ist

     φ(t) := f(a¯ + th̄) = f(a1 + th1,a2 + fh2) für 0 t 1

eine reellwertige Funktion einer reellen Veränderlichen, deren Ableitung sich gemäß der Kettenregel wie folgt berechnet

     φ(t) = xf(c̄)h1 + yf(c̄)h2.

Für x bzw. y schreiben wir kurz D1 bzw. D2. Damit ergibt sich

     φ(t) = h 1D1f + h2D2f = (h1D1 + h2D2)f,

wobei das Argument von f der Einfachheit halber weggelassen wurde.

Für n = 2 ist dann

     φ(t) = h1(h1D1D1f + h2D2D1f) + h2(h1D1D2f + h2D2D2f).

Nach dem Satz von Schwarz ist D1D2f = D2D1f und somit erhält man für DiDi := Di2, i = 1, 2,

     φ(t) = h12D 12f + 2h 1h2D1D2f + h22D 22f.

In Analogie zur binomischen Formel schreiben wir für h12D 12f + 2h 1h2D1D2f + h22D 22f im folgenden auch (h1D1 + h2D2)(2)f.

Analog erhält man für φ(k)(t), 0 t 1, die Darstellung

     φ(k)(t) = (h 1D1 + h2D2)(k)f.

(Beweis induktiv über k)

Ist M IRn offen, f Cm+1(M) und sind a¯ = (a1,,an), a¯ + th̄ mit 0 t 1 und h̄ = (h1,,hn) Elemente aus M, deren Verbindungsstrecke ganz zu M gehört, und ist φ(t) = f(a¯ + th̄) = f(a1 + th1,,an + thn), dann ist

     φ(t) = i=1nh i xif(a¯ + th̄).

Schreibt man Di für xi, so erhält man

     φ(t) = i=1nh iDif und φ(t) = i,j=1nh ihjDiDjf

      = (h1D1 + + hnDn)(2)f,

wenn man den Satz von Schwarz und eine der binomischen Formel (für n Summanden) analoge Schreibweise benutzt.

Induktiv zeigt man schließlich

     φ(k)(t) = (h 1D1 + + hnDn)(k)f.

Jetzt sind wir in der Lage, den Taylorschen Satz in übersichtlicher Weise zu formulieren.

Satz 8.12 (Satz von Taylor für Funktionen mit n Veränderlichen) Sei f : IRn IR, c̄ IRn, U eine offene Umgebung von c̄ und f Cm+1(U). Sei x̄ U, so daß die Verbindungsstrecke von c̄ und x̄ ganz zu U gehört. Für x̄ -c̄ = (x1 - c1,,xn - cn) := (h1,,hn) = h̄ gilt dann : Es gibt ein ϑ IR mit 0 < ϑ < 1, so daß f(x̄) = i=0m 1 i!(h1D1 + + hnDn)(i)f(c̄) + R m(x̄), wobei Rm(x̄) = 1 (m + 1)!(h1D1 + + hnDn)(m+1)f(c̄ + ϑh̄).

Beweis. Sei φ(t) := f(c̄ + th̄), 0 t 1. Dann ist φ(t) als reellwertige Funktion einer reellen Veränderlichen offenbar (m + 1)-mal differenzierbar. Nach dem Taylorschen Satz für Funktionen einer Veränderlichen gibt es ein ϑ mit 0 < ϑ < 1, so daß

     φ(1) = φ(0) + i=1mφ(i)(0) i! (1 - 0)i + φ(m+1)(0 + ϑ(1 - 0)) (m + 1)! (1 - 0)m+1

      = φ(0) + i=1mφ(i)(0) i! + φ(m+1)(ϑ) (m + 1)! .

Es ist

     φ(1) = f(x̄), φ(0) = f(a¯), φ(i)(0) = (h 1D1 + + hnDn)(i)f(c̄)

für i = 1,,m und

     φ(m+1)(ϑ) = (h 1D1 + + hnDn)(m+1)f(c̄ + ϑh̄).

Hieraus folgt die Behauptung.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Korollar.   (1)

Für m = 0 liefert der Satz von Taylor (wie für Funktionen mit einer Veränderlichen) den Mittelwertsatz als Spezialfall.

  (2)

Für m = 1, n = 2 und a¯ = (a,b), x̄ = (x,y), h̄ = x̄ -a¯ = (x - a,y - b) und ū := a¯ + ϑh̄ erhält man f(x,y) = f(a,b) + fx(a¯)(x - a) + fy(a¯)(y - b)+      1 2!fxx(ū)(x - a)2 + 2f xy(ū)(x - a)(y - b) + fyy(ū)(y - b)2.

  (3)

Gilt zusätzlich zu den Voraussetzungen des Satzes 8.12, daß f C(M) (d.h., f ist in M beliebig oft differenzierbar), dann läßt sich f in eine Potenzreihe (mit mehreren Veränderlichen) entwickeln. Wenn Rm(x̄)m0, so ist f(x̄) = i=0(h 1D1 + + hnDn)(i)f(a¯).

Beweis. (1) und (2) sind trivial; (3) zeigt man wie im eindimensionalen Fall.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Beispiel. Sei f(x,y) = ex+y und a¯ = (a,b) = (0, 0). Dann ist D1f(x,y) = ex+y und D2f(x,y) = ex+y. Folglich ist f beliebig oft stetig partiell differenzierbar und es ist DikD jmf(x,y) = ex+y und somit insbesondere DikD jmf(0, 0) = 1 für i,j {1, 2}.

Wegen h1 = x - 0 = x, h2 = y - 0 = y und (h1D1 + h2D2)(m)f(0, 0) = (x + y)m gilt

     ex+y = m=0 1 m!(x + y)m = m=0 1 m! i=0mm i xiym-i = m=0 i+j=mm 1 i!j!xiyj. (Man hätte diese Reihe natürlich auch anders gewinnen können.)

Wir befassen uns jetzt mit lokalen Extrema bei Funktionen mit zwei und mehr Veränderlichen.

In den Sätzen 7.15 und 7.16 sind (für differenzierbare Funktionen mit einer Veränderlichen) gewisse Bedingungen für das Vorliegen eines lokalen Extremums an einer Stelle c angegeben worden; und zwar eine notwendige Bedingung: f(c) = 0 und eine hinreichende Bedingung: f(c)0.

Ähnliche, wenn auch kompliziertere, Bedingungen gibt es auch für Funktionen mit zwei (und mehr) Veränderlichen, mit denen wir uns jetzt befassen.

Definition. (lokales Extremum) Sei f : IRn IR und c̄ ein innerer Punkt von D(f). f besitzt an der Stelle c̄ ein relatives oder lokales Extremum (:= lokales Minimum bzw. lokales Maximum) =Df

Es gibt eine Umgebung U(c̄), so daß für jedes x̄ U(c̄) mit x̄c̄ gilt: f(x̄) > f(c̄) für ein lokales Minimum und f(x̄) < f(c̄) für ein lokales Maximum.

Satz 8.13 (Notwendige Bedingung für die Existenz eines lokalen Extremums) Sei f(x̄) : IRn IR in einer Umgebung von c̄ definiert und in c̄ nach allen Variablen partiell differenzierbar. Besitzt f in c̄ ein lokales Extremum, dann sind alle (ersten) partiellen Ableitungen von f in c̄ null. (Wenn f xi(c̄) = 0 für i = 1,,n, also gradf(c̄) = 0̄, dann heißt c̄ auch kritischer oder stationärer Punkt von f.)

Beweis. Habe o.B.d.A. f in c̄ ein lokales Minimum (für ein lokales Maximum verläuft der Beweis analog). Dann gibt es eine Umgebung U(c̄), so daß für jedes x̄ U(c̄) mit x̄c̄ gilt: f(x̄) > f(c̄). Dies gilt insbesondere für x̄ := c̄ + hε¯i, wenn h hinreichend klein ist.

Nach Voraussetzung ist die Funktion φ(h) := f(c̄ + hε¯i) (als Funktion von h) in h = 0 differenzierbar, und es ist φ(0) = f xj(c̄). Offenbar besitzt φ (als Funktion einer Veränderlichen) in 0 ein lokales Minimum. Folglich gilt nach Satz 7.15:

     φ(0 ̄) = 0 = f xi(c̄) für i = 1,,n.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Beispiel. Sei f(x,y) = x2 + y2. Wir berechnen die kritischen Stellen von f. Es ist

     f x(x,y) = 2x = 0 x = 0

und

     f y(x,y) = 2y = 0 y = 0.

Die einzige kritische Stelle ist (0, 0). Höchstens dort kann f ein lokales Extremum besitzen.

Im eindimensionalen Fall haben wir eine hinreichende Bedingung für das Vorliegen eines lokalen Extremums mit Hilfe des Taylorschen Satzes bewiesen. Analoge Überlegungen führen auch bei Funktionen mit mehreren Veränderlichen zum Ziel. Wir beschränken uns hier auf Funktionen mit zwei Veränderlichen, da der technische Aufwand für den n-dimensionalen Fall nicht unerheblich ist.

Ist c̄ IR2, U eine Umgebung von c̄ = (a,b), f zweimal stetig differenzierbar in U und x̄ = (x,y) hinreichend dicht bei c̄, dann gilt nach dem Satz von Taylor (für m = 1, n = 2, h̄ = x̄ -a¯ = (x - a,y - b) := (h,k) und ū := a¯ + ϑh̄)

f(x̄) - f(c̄) = fx(c̄)h + fy(c̄)k + 1 2fxx(ū)h2 + 2f xy(ū)hk + fyy(ū)k2.()

Sind die notwendigen Bedingungen für das Vorliegen eines lokalen Extremums erfüllt, d.h., fx(c̄) = fy(c̄) = 0, dann erhält man

     f(x̄) - f(c̄) = 1 2h2f xx(ū) + 2hkfxy(ū) + k2f yy(ū) = R1(x̄).

Ob f an der Stelle c̄ ein lokales Extremum besitzt, hängt allein von dem Restglied ab. Aufgrund der Stetigkeit der zweiten partiellen Ableitungen in U wechseln diese in einer hinreichend kleinen Umgebung von c̄ ihr Vorzeichen nicht, falls sie an der Stelle c̄ von null verschieden sind. Dies nutzen wir aus, um ein handhabbares Kriterium zur Verfügung zu haben.

Satz 8.14 (Hinreichende Bedingung für die Existenz eines lokalen Extremums) Es sei f : IR2 IR, c̄ IR2 und f sei in einer Umgebung von c̄ zweimal stetig differenzierbar. Weiterhin sei c̄ ein kritischer Punkt von f und D = fxx(c̄)fxy(c̄) fxy(c̄)fyy(c̄) . Dann gilt : (1)

Ist D > 0, dann besitzt f in c̄ ein lokales Extremum, und zwar ein lokales Minimum, falls fxx(c̄) > 0 und ein lokales Maximum, falls fxx(c̄) < 0.
(2)
Ist D < 0, dann besitzt f in c̄ einen sog. Sattelpunkt (das ist ein kritischer Punkt, in dem die betrachtete Funktion weder ein lokales Minimum noch ein lokales Maximum besitzt; vgl. Abb. 8.11).
(3)
Ist D = 0, dann läßt sich (allein mit Hilfe der zweiten partiellen Ableitungen) noch keine Aussage treffen.

Beweis. Wir benutzen die gleichen Bezeichnungen wie in der obigen Formel (). Da nach Voraussetzung fx(c̄) und fy(c̄) null sind, erhält man aus ()

     f(x̄) - f(c̄) = 1 2h2f xx(ū) + 2hkfxy(c̄) + k2f yy(ū) = R1(x̄).

(1). Nach Voraussetzung ist

     D := D(c̄) = fxx(c̄)fyy(c̄) - fxy2(c̄) > 0.

Betrachtet man D(ū) als Funktion von ū = c̄ + ϑ(x̄ -c̄), dann ist wegen f C2(U) die Funktion D(ū) in U stetig und somit D(ū) > 0, falls x̄ hinreichend nahe bei c̄ liegt.

Analog gilt für fxx(c̄)< >0 auch fxx(ū)< >0.

Im folgenden schreiben wir für fxx(ū), fxy(ū), fyy(ū) kurz fxx, fxy, fyy.

Da fxx nicht null ist, erhält man

     f(x̄) - f(c̄) = 1 2fxx h2f xx2 + hkf xxfxy + k2f xxfyy

      = 1 2fxx (hfxx + kfyy)2 0 + k2(f xxfyy - fxy2 >0).

Da der Ausdruck in den eckigen Klammern für k0 positiv ist, hängt das Vorzeichen von f(x̄) - f(c̄) nur von fxx(c̄) ab. (Für k = 0 gilt nach () schon f(x̄) - f(c̄) = h2 2 fxx.)

Also für fxx(c̄) > 0 besitzt f an der Stelle c̄ ein lokales Minimum und für fxx(c̄) < 0 ein lokales Maximum.

(2). Sei D < 0. Setzt man h = k bzw. h = -k, dann erhält man

     f(x̄) - f(c̄) = h2 2 (fxx + 2fxy + fyy) bzw.

     f(x̄) - f(c̄) = h2 2 (fxx - 2fxy + fyy).

Es sei zunächst fxx(c̄) = fyy(c̄) = 0. Wegen D(c̄) < 0 ist dann fxy(c̄)0 und somit

     f( x ¯ )f( c ¯ ) x ¯ c ¯ 2 f xy ( c ¯ ), falls h=k und MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaWaa0aaaeaacaWG4baaaaGaayjkaiaawMcaaiabgkHiTiaadAga daqadaqaamaanaaabaGaam4yaaaaaiaawIcacaGLPaaadaGdOaWcbe qaamaanaaabaGaamiEaaaacqGHsgIRdaqdaaqaaiaadogaaaaakiaa wkziaiaaikdacaWGMbWaaSbaaSqaaiaadIhacaWG5baabeaakmaabm aabaWaa0aaaeaacaWGJbaaaaGaayjkaiaawMcaaiaabYcacaqGGaGa aeOzaiaabggacaqGSbGaaeiBaiaabohacaqGGaGaamiAaiabg2da9i aadUgacaqGGaGaaeyDaiaab6gacaqGKbaaaa@56A8@

f( x ¯ )f( c ¯ ) x ¯ c ¯ 2 f xy ( c ¯ ), falls h=k . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaWaa0aaaeaacaWG4baaaaGaayjkaiaawMcaaiabgkHiTiaadAga daqadaqaamaanaaabaGaam4yaaaaaiaawIcacaGLPaaadaGdOaWcbe qaamaanaaabaGaamiEaaaacqGHsgIRdaqdaaqaaiaadogaaaaakiaa wkziaiabgkHiTiaaikdacaWGMbWaaSbaaSqaaiaadIhacaWG5baabe aakmaabmaabaWaa0aaaeaacaWGJbaaaaGaayjkaiaawMcaaiaabYca caqGGaGaaeOzaiaabggacaqGSbGaaeiBaiaabohacaqGGaGaamiAai abg2da9iabgkHiTiaadUgacaqGGaGaaeOlaaaa@5663@

Dies bedeutet, daß in jeder Umgebung von c̄ sowohl positive als auch negative Werte von f(x̄) - f(c̄) auftreten. Folglich besitzt f in c̄ kein lokales Extremum.

Es bleibt noch der Fall zu betrachten, daß fxx(c̄)0 oder fyy(c̄)0.

Sei o.B.d.A. fxx(c̄)0. Dann erhält man für k = 0

     f(x̄) - f(c̄) = h2 2 fxx.

Für hinreichend nahe bei c̄ gelegene x̄ haben f(x̄) - f(c̄) und fxx(c̄) das gleiche Vorzeichen.

Sei jetzt h = -sfxy(c̄) und k = sfxx(c̄) für „kleine“ s0. Dann gilt

     f(x̄) - f(c̄) = s2 2 fxy2(c̄)f xx - 2fxy(c̄)fxx(c̄)fxy + fxx2(c̄)f yy.

Wegen f C2(U) gilt

     f( x ¯ )f( c ¯ ) x ¯ c ¯ s 2 2 ( f xy 2 ( c ¯ ) f xx ( c ¯ )2 f xy 2 ( c ¯ ) f xx ( c ¯ )+ f xx 2 ( c ¯ ) f yy ( c ¯ ) ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaWaa0aaaeaacaWG4baaaaGaayjkaiaawMcaaiabgkHiTiaadAga daqadaqaamaanaaabaGaam4yaaaaaiaawIcacaGLPaaadaGdOaWcbe qaamaanaaabaGaamiEaaaacqGHsgIRdaqdaaqaaiaadogaaaaakiaa wkziamaalaaabaGaam4CamaaCaaaleqabaaeaaaaaaaaa8qacaaIYa aaaaGcpaqaaiaaikdaaaWaaeWaaeaacaWGMbWaa0baaSqaaiaadIha caWG5baabaGaaGOmaaaakmaabmaabaWaa0aaaeaacaWGJbaaaaGaay jkaiaawMcaa8qacqGHflY1caWGMbWaaSbaaSqaaiaadIhacaWG4baa beaakmaabmaabaWaa0aaaeaacaWGJbaaaaGaayjkaiaawMcaaiabgk HiTiaaikdacaWGMbWaa0baaSqaaiaadIhacaWG5baabaGaaGOmaaaa kmaabmaabaWaa0aaaeaacaWGJbaaaaGaayjkaiaawMcaaiabgwSixl aadAgadaWgaaWcbaGaamiEaiaadIhaaeqaaOWaaeWaaeaadaqdaaqa aiaadogaaaaacaGLOaGaayzkaaGaey4kaSIaamOzamaaDaaaleaaca WG4bGaamiEaaqaaiaaikdaaaGcdaqadaqaamaanaaabaGaam4yaaaa aiaawIcacaGLPaaacqGHflY1caWGMbWaaSbaaSqaaiaadMhacaWG5b aabeaakmaabmaabaWaa0aaaeaacaWGJbaaaaGaayjkaiaawMcaaaWd aiaawIcacaGLPaaaaaa@7543@

      = s2 2 fxx(c̄)fxx(c̄)fyy(c̄) - fxy2(c̄) <0.

Folglich haben f(x̄) - f(c̄) und fxx(c̄) unterschiedliches Vorzeichen, und damit besitzt f in c̄ kein lokales Extremum. Den Fall fyy(c̄)0 beweist man durch ähnliche Überlegungen.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Die folgende Abbildung zeigt eine Funktion mit Sattelpunkt.

PICT

In den Quadranten, in denen x und y jeweils nur positive bzw. nur negative Werte annehmen, ist die Funktion f(x,y) stets negativ, in den Quadranten, wo jeweils ein Wert positiv und ein Wert negativ ist, ist die Funktion positiv. Entlang der x-Achse und der y-Achse ist die Funktion stets null. Die dargestellte Fläche läßt sich offenbar allein durch Geraden erzeugen.

Wir fahren jetzt fort mit der Untersuchung unseres Beispiels. Hierzu benutzen wir das oben erhaltene Kriterium.

Offenbar sind die zweiten partiellen Ableitungen an der kritischen Stelle (0, 0) stetig. Denn es ist

     fxx(x,y) = 2, fxy(x,y) = fyx(x,y) = 0, fyy(x,y) = 2,

und damit gilt

     D = fxx(0 ̄)fxy(0 ̄) fxy(0 ̄)fyy(0 ̄) = 20 02 = 40.

Wegen fxx(0 ̄) = 2 > 0 besitzt f in 0 ̄ ein lokales Extremum (vgl. auch Abb. 8.5 und Abb. 8.8 b).

Wir betrachten jetzt das Beispiel f(x,y) = x2 - y2.

Die folgende Abbildung zeigt diese Funktion; sie stellt ebenfalls eine Sattelfläche dar, die an der Stelle (0, 0) einen Sattelpunkt besitzt.

 

PICT

Es ist

     fx(x,y) = 2x, fy(x,y) = -2y,

     fxx(x,y) = 2, fxy(x,y) = fyx(x,y) = 0, fyy(x,y) = -2.

Dann ist 0 ̄ wieder ein kritischer Punkt von f, aber

     D = 20 0-2 = -4 < 0,

folglich besitzt f in 0 ̄ einen Sattelpunkt.

Bemerkung. Nach unserer Definition sind die Extremstellen einer Funktion f immer innere Punkte des betrachteten Definitionsbereiches (man kann dies auch anders definieren !). Ist man nicht nur an lokalen sondern auch an absoluten (oder globalen) Extrema (im Gegensatz zu lokalen Extremstellen) interessiert, dann muß noch der Teil des Randes des Definitionsbereiches untersucht werden, der selbst zum Definitionsbereich gehört. Schränkt man die Funktion f auf den betreffenden Teil des Randes ein, dann erhält man (in Abhängigkeit von der Kompliziertheit des Randes) oft eine „handhabbare“ Funktion g mit einer Veränderlichen. Die lokalen und globalen Extrema für g (falls solche existieren) müssen dann mit den lokalen Extrema von f verglichen werden.

8.4 Implizite Funktionen

In diesem Abschnitt befassen wir uns mit der (nicht einfachen Problematik der) Auflösbarkeit von Gleichungssystemen. Die lineare Algebra stellt bekanntlich gut nutzbare Werkzeuge für die Auflösung von linearen Gleichungssystemen bereit. Diese Hilfsmittel versagen jedoch im nichtlinearen Fall. Zur Verdeutlichung der Auflösbarkeit solcher Systeme starten wir mit einem linearen Gleichungssystem, das gegeben ist durch

     Ax̄ = b¯ , wobei A = a11 a1n am1amn , x̄ = x1 xn , b¯ = b1 bm .

Das Gleichungssystem ist bekanntlich genau dann lösbar (d.h. nach x1,,xn auflösbar), wenn der Rang der Koeffizientenmatrix mit dem der erweiterten Koeffizientenmatrix übereinstimmt. Für den Fall, daß m = n und der Rang von A ebenfalls n ist (d.h. die Determinante detA von A nicht null ist), läßt sich das Gleichungssystem stets eindeutig lösen. Ist das Gleichungssystem lösbar, n > m und (nach eventueller Umsortierung der Koeffizienten)

     det a11 a1m am1amm 0 ,

dann gibt es lineare Funktionen f1(xm+1,,xn),,fm(xm+1,,xn), so daß

     xi = fi(xm+1,,xn) für i = ,m.

Für x̄ = (xm+1,,xn), ȳ = x1 xm und f = f1 fm erhält man somit

     ȳ = f1(x̄) fm(x̄) = f(x̄).

Wir befassen uns jetzt mit beliebigen Gleichungssystemen. Dazu betrachten wir zunächst eine Gleichung mit zwei Unbekannten.

Definition. (Implizit definierte Funktion) Sei f : IR2 IR, a¯ = (a,b) und f in einer Umgebung U(x̄) definiert und f(a,b) = 0. Weiterhin seien ε,δ > 0, jedoch so klein, daß Uδ(a) × Uε(b) U(a¯).

Durch die Gleichung f(x,y) = 0 ist in der Umgebung Uδ(a) eine Funktion g : IR IR implizit definiert =Df

Für jedes x Uδ(a) gibt es genau ein y Uε(b), so daß f(x,y) = 0 und y = g(x) (insbesondere ist b = g(a)).

PICT

Beispiel. Sei f(x,y) = x2 + y2 - 1.

f(x,y) = 0 ( x2 + y2 = 1) definiert in IR2 eine Kreislinie mit dem Radius 1 und dem Mittelpunkt (0,0).

Sei a¯ = (a,b) IR2 und f(a¯) = 0, dann ist a¯ ein Punkt der Kreislinie. Für a ± 1 und ε > 0 gibt es ein δ > 0, so daß für jedes x Uδ(a) genau ein y Uε(b) existiert mit f(x,y) = 0. In diesem Fall ist y = g(x) = x.

PICT

Satz 8.15 (Hauptsatz über implizite Funktionen mit zwei Veränderlichen) Voraussetzung :   (1) Sei M IR eine offene Menge und f : IR2 IR stetig in M.   (2) Sei c̄ = (a,b) M und f(c̄) = 0.   (3)

f ist in einer Umgebung U(c̄) stetig partiell nach y differenzierbar und fy(c̄)0.
Behauptung : Es gibt eine stetige Funktion g : IR IR, für die gilt : Für jedes ε > 0 gibt es ein δ > 0, so daß für jedes x Uδ(a) genau ein y Uε(b) existiert mit f(x,y) = 0 und y = g(x) (insbesondere ist b = g(a)).

Beweis. Da fy(c̄)0 und fy in U(c̄) stetig ist, gibt es eine Umgebung U(c̄), so daß fy dort stets positiv oder stets negativ ist. Sei o.B.d.A. fy(c̄) > 0 (fy(c̄) < 0 analog).

Wir wählen jetzt d > 0, jedoch so klein, daß Ud(a) × Ud(b) U(c̄).

Da fy(a,y) > 0 für alle y Ud(b), ist fy in Ud(b) streng monoton wachsend. Sei 0 < ε < d und y1 := b - ε, y2 := b + ε. Wegen f(a,b) = 0 ist f(a,y1) < 0 < f(a,y2). Da f(x,y1),f(x,y2) als Funktionen von x stetig sind, gibt es ein δ mit 0 < δ < ε, so daß für jedes x Uδ(a) gilt: f(x,y1) < 0 < f(x,y2).

Für x0 Uδ(a) ist also f(x0,y) in [y1,y2] stetig und

     f(x0,y1) < 0 < f(x0,y2).

Nach dem Zwischenwertsatz (für Funktionen einer Veränderlichen) gibt es ein y0 [y1,y2], so daß f(x0,y0) = 0.

Da fy in U(c̄) stets positiv ist, erhält man insbesondere fy(x0,y) > 0. Folglich ist f(x0,y) streng monoton wachsend und somit y0 das einzige Element in Uε(b) mit f(x0,y0). Durch g(x0) := y0 für x0 Uδ(a) ist eine Funktion g definiert.

Es bleibt noch zu zeigen, daß g in Uδ(a) stetig ist.

Sei x0 Uδ(a), ε > 0 (wie oben) und δ > 0, jedoch so klein, daß Uδ(x0) Uδ(a) und |x - x0| < δ. Nach den vorhergehenden Betrachtungen existiert für x Uδ(a) genau ein y [b - ε,b + ε], so daß f(x,y) = 0, also g(x) = y.

Damit erhält man

     |g(x) - g(x0)| = |y - y0||y - b|<ε + |b - y0|<ε < 2ε.

Hieraus folgt die Stetigkeit von g in x0.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Korollar. Gilt zusätzlich zu den Voraussetzungen von Satz 8.15 noch   (4) f ist in U(c̄) stetig partiell nach x differenzierbar, dann ist die durch f(x,y) = 0 in Uδ(a) implizit definierte Funktion g differenzierbar, und es gilt : g(x) = -fx(x,y) fy(x,y).

Beweis. Wir wählen die Bezeichnungen wie im vorhergehenden Beweis. Sei |x - x0| < δ, xa und y = g(x), dann ist (x,y) Uδ(x0) × Uε(b) := D, und die Verbindungsstrecke zwischen (a,b) und (x,y) gehört ganz zu D. Nach dem Mittelwertsatz für Funktionen mit mehreren Veränderlichen gilt (er kann hier angewendet werden, da f(x,y) nach Voraussetzung differenzierbar ist):

     f(x,y) =0 - f(a,b) =0 = 0 = (x - a)fx(ū) + (y - b)fy(ū),

wobei ū = a¯ + ϑ(x̄ -c̄), y = g(x) und b = g(a). Hieraus folgt

     y - b x - a = g(x) - g(a) x - a = -fx(ū) fy(ū) .

Da g in Uδ(a) stetig ist, gilt für x a auch y = g(x) g(a) = b und somit ū a¯. Folglich existiert

     lim xag(x) - g(a) x - a =g(a) = -fx(c̄) fy(c̄) ,

also

     g(x) = -fx(x,y) fy(x,y) .   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Beispiel. Es sei f(x,y) = x3 + y3 - 2xy - 1.

Für f gelten die folgenden Voraussetzungen:

1. f : IR2 IR ist in einer Umgebung U(c̄) mit c̄ = (1, 0) stetig. 2. f(1, 0) = 0. 3. f ist in U(c̄) stetig partiell nach y differenzierbar und fy(1, 0) = -20.

Nach dem Satz über implizite Funktionen gibt es dann eine stetige Funktion g : IR IR, für die gilt:

Für jedes ε > 0 gibt es ein δ > 0, so daß für alle x Uδ(1) genau ein y Uε(0) existiert mit f(x,y) = 0 und g(x) = y.

Offenbar ist auch f stetig partiell nach x differenzierbar. Damit ist (nach dem letzten Korollar) g in Uδ(1) differenzierbar und

     y = g(x) = -fx(x,y) fy(x,y) = 3x2 - 2y 3y2 - 2x .

Hierbei entsteht eine Gleichung, die eine unbekannte Funktion y und deren Ableitung y enthält. (Gleichungen dieser Art heißen Differentialgleichungen.)

Abschließend soll noch der Hauptsatz über implizite Funktionen mit mehreren Veränderlichen ohne Beweis angegeben werden. (Siehe hierzu Literaturangabe [4], Teil II, Seite 235 – 242.)

Dazu benötigen wir noch die folgende Definition.

Definition. (implizit definierte Funktionen mit mehreren Veränderlichen) Sei f : IRn+m IRm, a¯ = (a 1,,an), b¯ = (b1,,bm), c̄ = (a¯,b¯) und f in einer Umgebung U(c̄) IRn+m definiert und f(c̄) = 0 ̄. Weiterhin seien ε,δ > 0, jedoch so klein, daß Uδ(a¯) × Uε(b¯) U(c̄).

Durch die Gleichung f(x̄,ȳ) = 0 ̄ ist in der Umgebung Uδ(a¯) eine Funktion g : IRn IRm implizit definiert =Df

Für jedes x̄ Uδ(a¯) gibt es genau ein ȳ Uε(b¯), so daß f(x̄,ȳ) = 0 ̄ und ȳ = g(x̄) (insbesondere ist b¯ = g(a¯)).

Satz 8.16 (Hauptsatz über implizite Funktionen) Voraussetzung :

  (1)

Sei M IRn+m eine offene Menge und f = (f1,,fm) : IRn+m IRm stetig in M.
  (2) Sei c̄ = (a¯,b¯) und f(c̄) = 0 ̄.   (3)
f1,,fm seien in einer Umgebung U(c̄) nach allen Variablen y1,,ym stetig partiell differenzierbar und die Determinante der Funktionalmatrix (f1,,fm) (y1,,ym) (c̄) sei (an der Stelle c̄) nicht null.

Behauptung :

Es gibt eine stetige Funktion g : IRn IR, für die gilt : Für jedes ε > 0 gibt es ein δ > 0, so daß für jedes x̄ Uδ(a¯) genau ein ȳ Uε(b¯) existiert mit f(x̄,ȳ) = 0 und ȳ = g(x̄) (insgesondere ist g(a¯) = b).

Beweis. Siehe Literaturangabe [4], Teil II, Seite 235.   <mi 
>P</mi><mi >I</mi><mi >C</mi><mi >T</mi>

Schwerpunkte für die Wiederholung von Kapitel 8