8.1 Differenzierbarkeit
In Kapitel 7 wurden zwei äquivalente Definitionen für die Differenzierbarkeit von Funktionen mit einer Veränderlichen angegeben. Wir werden jetzt die zweite der Definitionen, die die lineare Approximation benutzt, für Funktionen bzw. mit mehreren Veränderlichen verallgemeinern. Hierzu machen wir zunächst einen kleinen Exkurs in die lineare Algebra.
Eine lineare Abbildung ( Vektorräume mit kanonischer Basis) kann als Matrix aufgefaßt werden:
Die Elemente sind dann sog. Spaltenvektoren:
und es ist
.
Ist , dann besteht die Matrix nur aus einer Zeile, die dann als Vektor in aufgefaßt werden kann. Hierfür wählen wir die Bezeichnung . In diesem Fall schreibt man (der Einfachheit wegen aus drucktechnischen Gründen) die Vektoren als Zeilen : . Dann ist
das Skalarprodukt der beiden Vektoren.
Ist zusätzlich , also , dann besteht die Matrix (bzw. der Vektor) nur aus einer Komponente : . Wendet man auf einen „Vektor“ aus an, so erhält man . Für bzw. schreiben wir dann einfach bzw. .
Diese Bezeichnungsweise ausnutzend liefert die zweite Definition der Differenzierbarkeit aus Kapitel 7, 7/1/10 folgende Formulierung:
ist in einer Umgebung definiert, und es existiert eine lineare Abbildung und eine Funktion mit , so daß für jedes gilt:
Diese Formulierung läßt sich sofort auf Funktionen und Elemente erweitern.
Definition. (Differenzierbarkeit, Ableitung) Sei und . ist in differenzierbar (oder total differenzierbar) =Df
Die Matrix heißt dann 1. Ableitung von an der Stelle . Bez.: .
Als wichtigsten Spezialfall erhält man die Differenzierbarkeit bzw. die Ableitung einer Funktion an der Stelle . besteht in diesem Falle nur aus einer Zeile. Die Ableitung ist dann ein Vektor (im allgemeinen ist eine Matrix). Dieser Vektor heißt auch Gradient von an der Stelle (oder kurz in ). Bez.: .
Das Wesen der Differenzierbarkeit besteht auch hier in der linearen Approximierbarkeit einer Funktion in einer Umgebung ; d.h., läßt sich in darstellen als plus einem Rest , der in „klein“ ist, wobei hier ’klein’ bedeuten soll, daß
Durch wird eine Punktmenge in beschrieben. Die durch definierte Punktmenge heißt Tangentialebene von an der Stelle , und heißt Gleichung der Tangentialebene.
Der Punkt erfüllt diese Gleichung, d.h., er liegt in der Tangentialebene.
Der Anteil von der Funktion heißt Differential (oder 1. Differential) von in . Wir werden auf diese Begriffe noch einmal zurückkommen, insbesondere im Zusammenhang mit der Berechnung und Darstellung der Ableitung und damit auch der Tangentialebene und des Differentials.
Um die Analogie bei der Differenzierbarkeit von Funktionen einer und mehrerer Veränderlicher besser zu veranschaulichen, betrachten wir die folgenden beiden Spezialfälle.
Für (also und ) definiert eine Gerade in , die Tangente von an der Stelle .
Für und wird durch eine Ebene in bestimmt, die offenbar den Punkt enthält. In diesem Fall ist der Begriff „Tangentialebene“ wörtlich zu nehmen.
Wir haben bereits die Ableitung einer Funktion mit mehreren Veränderlichen definiert, wir haben aber noch kein praktikabeles Verfahren, um die Ableitung einer konkreten Funktion zu berechnen. Dazu betrachten wir zunächst Funktionen und definieren den Begriff der partiellen Ableitbarkeit.
Definition. (partielle Ableitung) Sei und in einer Umgebung definiert. ist in partiell nach differenzierbar () =Df
Nach der früheren Differenzierbarkeitsdefinition bedeutet dies, daß die folgenden Limites existieren:
für
Der Limes selbst (falls er existiert) heißt partielle Ableitung von nach an der Stelle (oder kurz: in ). Bez.:
Für und , wobei die Eins in an der -ten Stelle steht, existieren die folgenden Limites:
Beispiel. Sei .
Dann ist
Allgemein ist
Analog erhält man
Die Abbildung 8.1 zeigt die geometrische Veranschaulichung der partiellen Ableitungen für eine Funktion mit zwei Veränderlichen.
Die partielle Ableitung nach gibt also den Anstieg der Tangente in Richtung der Achse an. Wir werden diese Art der Ableitung noch einmal verallgemeinern zur sog. Richtungsableitung. Dazu geben wir uns (durch einen geeigneten Vektor) eine beliebige Richtung vor und betrachten den Anstieg der Tangente in diese Richtung, falls die zugrundegelegte Funktion dies zuläßt. Daraus ergibt sich folgende Definition.
Definition. (Richtungsableitung) Es sei und in einer Umgebung definiert. Weiterhin sei und ist an der Stelle in Richtung differenzierbar =Df
Bemerkung. (1) Der Vektor , der die Richtung festlegt, wird stets mit der Länge 1 gewählt, damit die Richtungsableitung nur von der Richtung und nicht von der Länge des Vektors abhängt. (2) Wie auch bei Funktionen einer Veränderlichen können Ableitung, partielle Ableitungen und Richtungsableitungen einer Funktion in einer Menge gebildet werden, wenn die entsprechenden Ableitungen in jedem Punkt der Menge existieren. Diese Ableitungen beschreiben neue in definierte Funktionen, die wir der Reihe nach mit bezeichnen.
Abb. 8.2 - dynamisch: Bewegen der Abbildung mit der Maus
Satz 8.1 Sei und . Ist in differenzierbar, dann ist in stetig.
Beweis. Sei in differenzierbar. Dann existiert eine Umgebung , so daß für jedes gilt:
Offenbar gilt
Nach Satz 6.8 ist eine Vektorfunktion stetig, wenn alle
ihre Komponenten stetig sind. Dies trifft insbesondere auf
zu. Die Komponenten sind aber als lineare Funktionen (nach
Satz 6.11) stetig. Folglich gilt auch
Hieraus folgt die Behauptung.
Bemerkung. Aus der partiellen Differenzierbarkeit nach allen Variablen folgt im allgemeinen noch nicht die Stetigkeit, wie das folgende Beispiel zeigt.
Beispiel. Es sei an der Stelle nach und differenzierbar, denn es ist
und
Aber ist in nicht stetig, denn anderenfalls wäre Speziell für und gilt dann
!
Abb. 8.3 - dynamisch: Bewegen der Abbildung mit der Maus
Die nächsten drei Sätze stellen wichtige Beziehungen zwischen partieller und totaler Differenzierbarkeit her.
Satz 8.2 Sei und . Ist in einer Umgebung definiert und nach allen Variablen partiell differenzierbar und sind alle partiellen Ableitungen in stetig, dann ist in total differenzierbar, und für jedes gilt (D.h., die lineare Abbildung , die aufgrund der Differenzierbarkeit existiert, ist gegeben durch und )
Beweis. Wir betrachten hier nur den Spezialfall . Dazu sei und (den allgemeinen Fall beweist man analog). Mit Hilfe des 1. Mittelwertsatz der Differentialrechnung (leicht modifiziert) erhält man
(nach dem 1. Mittelwertsatz)
Folglich ist
Behauptung:
Nach Voraussetzung sind die partiellen Ableitungen in stetig, folglich gibt es für jedes ein so daß für jedes mit gilt:
(im allgemeinen Fall ist der Betrag ).
Die obige Abschätzung gilt auch entsprechend für die partiellen Ableitungen nach und nach .
Offenbar gilt:
denn für alle
Folglich ist erst recht
analog für und
Damit ergibt sich folgende Abschätzung:
Also
für
Hieraus folgt die Behauptung.
Bemerkung. Ist in einer Umgebung definiert und nach allen Variablen partiell differenzierbar und sind alle partiellen Ableitungen in stetig, dann läßt sich in durch die Funktion
linear approximieren. Es gilt also .
Satz 8.3 Sei und . Ist in differenzierbar (d.h., es gibt reelle Zahlen , so daß ) für alle in einer Umgebung ), dann existieren alle partiellen Ableitungen von in , und es ist (Die Ableitung ist also durch die partiellen Ableitungen eindeutig bestimmt.)
Beweis. Nach Voraussetzung gilt
auch speziell für
mit .
Folglich ist
Damit existiert
Satz 8.4 Sei und . Ist in differenzierbar (d.h., es gibt eine lineare Abbildung , also eine -Matrix , so daß für alle in einer Umgebung ), dann existieren alle partiellen Ableitungen und es ist (Die Abbildung ist also eindeutig bestimmt durch die partiellen Ableitungen
Beweis. Den Beweis führt
man analog wie zum Satz 8.2.
Bemerkung. Die Abbildung , also die 1. Ableitung der Vektorfunktion , heißt auch Funktionalmatrix oder Jacobimatrix von in . Bez.:
Ist , dann besteht die Matrix nur aus einer Zeile. In diesem Falle hat die 1. Ableitung oder der Gradient von die Gestalt
Ist in einer ganzen Umgebung differenzierbar, dann ist durch für jedes eine Funktion definiert. Diese Funktion bezeichnen wir mit
für ist . Für das Differential von an der Stelle schreiben wir auch oder kurz . Mit dieser Bezeichnung läßt sich die Tangentialebene folgendermaßen darstellen:
Wir werden jetzt noch gewisse Techniken im Umgang mit Differentialen entwickeln, die für manche Anwendungen sehr hilfreich sind. Dazu betrachten wir zunächst den eindimensionalen Fall und für . gibt den Anstieg der Tangente von in an. Faßt man die Zahl als Bruch auf, dann erhält man ( hängt hierbei natürlich von ab). Läßt man in der „Verhältniszahl“ den „Nenner“ konstant, dann verändert sich mit nur noch , d.h., ist dann eine Funktion von . (vgl. Abb. 8.4)
Sei jetzt . Manchmal schreibt man für auch und damit
Folglich erhält man
Betrachtet man die als Konstante, dann hängt nur von ab. Damit ist das Differential für die Funktion wieder eine Abbildung aus in , . Die Ableitung (mit veränderlichem ) ist hingegen eine Vektorfunktion Die Ableitung von (falls sie existiert) ist dann schon eine Matrix (Funktionalmatrix) usw. Die „Dimension“ der Ableitung wird also größer, die des Differentials nicht. Dies ist ein Vorteil, wenn man mit höheren Ableitungen bzw. Differentialen umgehen will.
Wir betrachten jetzt ein einfaches Beispiel für die Berechnung der Tangentialebene.
Beispiel. Es sei Gesucht ist die Gleichung der Tangentialebene von an der Stelle . (vgl. Abb. 8.5; ein weiteres Beispiel für die Darstellung einer Funktion und der Tangentialebene an einer Stelle ist in den Abb. 8.6 a und 8.6 b gegeben.)
Es ist
Folglich ist
Die Ebene geht durch die drei Punkte , wodurch die Ebene schon eindeutig bestimmt ist.
Abb. 8.6 - dynamisch: Bewegen der Abbildung mit der Maus
In dem folgenden Satz wird nachgewiesen, daß man aus der totalen Differenzierbarkeit die Richtungsableitbarkeit erhält und daß sich die Richtungsableitung mit Hilfe der partiellen Ableitungen berechnen läßt.
Satz 8.5 Sei und . Ist in differenzierbar, dann ist an der Stelle in jede Richtung mit differenzierbar, und es ist , wobei .
Beweis. Nach Voraussetzung gilt für alle aus einer Umgebung :
Speziell für erhält man dann
und schließlich
Folglich ist
Andererseits ist dieser Limes gleich
.
Hieraus folgt die Behauptung.
Wir befassen uns jetzt mit der Differenzierbarkeit zusammengesetzter Funktionen. Da sich die Ableitung einer Vektorfunktion auf die Ableitung ihrer reellwertigen Komponenten zurückführen läßt, werden wir uns im folgenden vorwiegend mit reellwertigen Funktionen befassen.
Satz 8.6 Differentiation rationaler Funktionen Seien und in differenzierbar. Dann gilt
Beweis. Den Beweis führt
man ähnlich wie für Funktionen einer reellen Veränderlichen; man hat hier
lediglich alle Beweisschritte für die partiellen Ableitungen vorzunehmen.
Satz 8.7 Spezialfall für die Kettenregel Es sei und also . Ist in und in differenzierbar, dann ist in differenzierbar, und es ist .
Beweis. Sei . Nach Voraussetzung ist in und in differenzierbar. Damit gilt:
für alle in einer Umgebung und , und es ist
für alle in einer Umgebung und
Da in differenzierbar, also dort auch stetig ist, gilt für auch . Nach Voraussetzung strebt für von höherer als 1. Ordnung gegen null, d.h., es gibt eine Funktion , so daß und .
Wir wählen jetzt . Damit erhält man insgesamt
Es bleibt zu zeigen, daß
ist konstant, folglich gilt
Weiterhin ist
Damit ist in durch
linear approximiert, folglich ist
Satz 8.8 Kettenregel Es sei und also . Ist in und in differenzierbar, dann ist in differenzierbar, und es ist . (Das Produkt der „inneren“ und der „äußeren“ Ableitung ist ein Produkt von Matritzen.)
Beweis. Die grundlegende
Beweisidee ist die gleiche wie im vorhergehenden Satz. Da der technische
Aufwand jedoch wesentlich größer ist, kann hier nur auf die Literatur
verwiesen werden. (vgl. z.B. Literaturangabe [4],
Teil II, Seite 217)
Bemerkung. Für und stellt sich die Ableitung von an der Stelle wie folgt dar, wobei ist:
und
Beispiele.
(1) Spezialfall einer Verkettung
Sei und , also , wobei . Speziell sei , also und . Für und erhält man
Offenbar ist eine reellwertige Funktion einer reellen Veränderlichen, folglich läßt sich die Ableitung nach den Regeln für Funktionen einer Veränderlichen bilden:
Wir werden jetzt die Ableitung nach den Regeln für Funktionen mehrerer Veränderlicher berechnen; es wird sich zeigen, daß das gleiche Ergebnis entsteht. Es ist
Folglich ist
Es ist
und
Dann ist
(2) Transformation in Polarkoordinaten
Bei der Lösung mathematischer Probleme, insbesondere in der Physik, der Technik und den Naturwissenschaften überhaupt, ist es oft vorteilhaft, die zu behandelnden Probleme mit Hilfe besonders geeigneter Koordinatensysteme zu beschreiben oder vom kartesischen Koordinatensystem zu einem anderen überzugehen. Da dieser Übergang häufig mit der Verkettung von Funktionen und die Lösung der anstehenden Probleme oft mit der Differenzierbarkeit der Verkettung verbunden ist, wollen wir hier einige wichtige nicht-kartesische Koordinatensysteme behandeln. Zunächst betrachten wir die sog. Polarkoordinaten, die schon bei der Behandlung der trigonometrischen Funktionen in Kapitel 5 (vgl. Abb. 5.21) eine gewisse Rolle spielten.
Es sei ein Punkt in der euklidischen Ebene, die mit einem kartesischen Koordinatensystem versehen ist, dessen Achsen mit bzw. bezeichnet werden. Offenbar läßt sich der Punkt auch eindeutig durch das Paar beschreiben, wobei der Abstand von zum Nullpunkt ist und den Winkel zwischen der -Achse und der Verbindungsstrecke von nach angibt ( in Bogenmaß gemessen). Damit ist der gleiche Punkt in der Ebene durch unterschiedliche Koordinatensysteme eindeutig beschrieben worden (vgl. Abb. 8.7). sind die kartesischen Koordinaten von , und heißen Polarkoordinaten. (Der Nullpunkt ist mit Hilfe der Polarkoordinaten nicht eindeutig darstellbar, da der Winkel hierfür beliebig sein könnte.)
Nach Voraussetzung gilt also
und
Betrachtet man den Punkt als variabel, , dann erhält man eine Abbildung
also
mit und
Wir betrachten jetzt ein Beispiel einer Funktion in kartesischen Koordinaten und in Polarkoordinaten.
Sei und , wobei der Definitionsbereich von ein Kreis mit dem Mittelpunkt und dem Radius sein soll, also .
Wir stellen jetzt in Polarkoordinaten dar. Für
und
ist
Insgesamt haben wir
Also
Die Ableitung der verketteten Funktion ergibt sich wie folgt:
Folglich gilt
Wir berechnen jetzt die Determinante der Funktionalmatrix von .
Bemerkung. (ohne Beweis) Sei und .
Ist die Determinante der Funktionalmatrix von in einer Umgebung von null verschieden, also
für alle ,
dann besitzt in eine Umkehrfunktion.
Speziell für unsere Transformationsfunktion gilt dann
Die Koordinatentransformation ist demnach außer im Punkt injektiv.
(3) Transformation in Zylinderkoordinaten
Analog wie im Beispiel (2) werden jetzt räumliche Koordinaten transformiert.
Damit ist der gleiche Punkt im Raum durch unterschiedliche Koordinatensysteme eindeutig beschrieben worden (vgl. Abb. 8.9). Die neuen Koordinaten heißen Zylinderkoordinaten. (Der Nullpunkt ist analog wie im vorhergehenden Beispiel mit Hilfe der Zylinderkoordinaten nicht eindeutig darstellbar.)
Es gilt also
Betrachtet man den Punkt als variabel, , dann erhält man eine Abbildung
also
mit und .
Die Ableitung der Funktion ergibt sich wie folgt:
Damit ist
Für ist die Transformation injektiv.
(4) Transformation in Kugelkoordinaten (oder sphärische Koordinaten)
Wir transformieren hierbei wieder räumliche Koordinaten. Dazu sei ein Punkt in dem Raum , der mit dem kartesischen Koordinatensystem aus Beispiel (3) versehen ist. Der Punkt wird erneut durch ein Koordinatentripel beschrieben, deren Bedeutung aus der Abbildung 8.10 hervorgeht.
gibt den Abstand zwischen und an. ist die Projektion von auf die -Ebene, und bezeichnet den Winkel, der durch die -Achse und die Verbindungsstrecke zwischen den Punkten und aufgespannt wird.
Offenbar ist dann
Folglich ist
Die neuen Koordinaten heißen Kugelkoordinaten oder auch sphärische Koordinaten. (Die Punkte auf der -Achse sind analog wie im vorhergehenden Beispiel mit Hilfe der Kugelkoordinaten nicht eindeutig darstellbar.)
Betrachtet man den Punkt als variabel, , dann erhält man eine Abbildung
also
mit und
Die Ableitung der Funktion ergibt sich wie folgt:
Damit ist
also
Für alle Punkte, die nicht auf der
-Achse
liegen,
ist die Transformation injektiv.
8.2 Partielle Ableitungen und Differentiale höherer Ordnung
Es sei in einer Umgebung eines Punktes nach allen Variablen partiell differenzierbar. Dann entstehen offenbar beim partiellen Differenzieren neue Funktionen die ebenfalls von abhängen. Diese partiellen Ableitungen können wieder nach gewissen Variablen partiell differenzierbar sein, etwa nach der Variablen .
Bildet man dann erhält man die 2. partielle Ableitung von nach und in . Bez.:
Für schreibt man
Ist , dann nennt man die 2. partiellen Ableitungen auch gemischte partielle Ableitungen.
Nach dem gleichen Muster definiert man induktiv die -ten partiellen Ableitungen. Hierfür benutzt man die Bezeichnung
wobei .
Satz 8.9 Satz von Schwarz Es sei und . Ist in einer Umgebung definiert und existieren in die partiellen Ableitungen und ist in stetig, dann existiert auch in , und es ist . (Unter den angegebenen Bedingungen sind die gemischten Ableitungen in gleich.)
Beweis. Es sei und .
Wir zeigen, daß existiert und gleich ist.
Nach Voraussetzung ist in partiell nach differenzierbar. Folglich läßt sich auf (bei festgehaltenem ) der 1. Mittelwertsatz der Differentialrechnung bezüglich anwenden. Damit erhält man für alle und :
(1. Mittelwertsatz, fest, )
( existiert in )
Da nach Voraussetzung in stetig ist, existieren die folgenden Limites und es gilt:
Bemerkung. Ist und und existieren in einer Umgebung die partiellen Ableitungen und und ist in stetig, dann existiert auch in , und es ist .
Den Beweis hierzu führt man leicht auf den vorhergehenden Satz zurück.
Wir befassen uns jetzt mit Differentialen höherer Ordnung. Dazu sei . Das 1. Differential wurde als Funktion definiert, die sich darstellen läßt in der Form
wobei die als konstant anzusehen sind.
Wir berechnen (definieren) jetzt das 2. Differential von wie folgt.
( konstant !)
().
Sind die gemischten Ableitungen gleich, dann gilt
Analog definiert man induktiv
(Hierbei ist der Satz von Schwarz sehr nützlich.)
Beispiel.
Sei . Dann ist
und
Folglich ist
Weiterhin ist
und schließlich
(denn alle dritten partiellen Ableitungen sind null).
8.3 Der Satz von Taylor; lokale Extrema für Funktionen mit mehreren Veränderlichen
Wir werden jetzt einige Ergebnisse aus der Differentialrechnung für Funktionen mit einer Veränderlichen auf Funktionen mit mehreren Veränderlichen erweitern. Wir beginnen zunächst mit dem Mittelwertsatz, der sich auch hier als Spezialfall des Taylorschen Satzes erweist.
Satz 8.10 Mittelwertsatz der Differentialrechnung mit mehreren Veränderlichen Sei offen und eine in differenzierbare Funktion. Weiterhin seien und die Verbindungsstrecke zwischen und gehöre zu . Dann gibt es ein mit , so daß .
Beweis. Wir betrachten zunächst eine Parameterdarstellung
von und definieren damit die Funktion mit der Eigenschaft
Offenbar ist in stetig und in differenzierbar. Dann läßt sich auf der 1. Mittelwertsatz der Differentialrechnung anwenden. Folglich existiert ein , so daß
Hieraus folgt
Bemerkung. Für Vektorfunktionen ist der Mittelwertsatz im allgemeinen falsch. Man betrachte das Beispiel mit .
Offenbar gibt es kein , so daß
Definition. (polygonzusammenhängend; Gebiet) Sei .
(1) ist polygonzusammenhängend =Df
(2) ist ein Gebiet =Df ist polygonzusammenhängend und offen.
Satz 8.11 Sei ein Gebiet und in differenzierbar. Dann gilt ist konstant in für alle .
Beweis. () trivial, da die partiellen Ableitungen von konstanten Funktionen null sind.
() Es sei für jedes und es seien . Dann gibt es nach Voraussetzung Elemente in , so daß für .
Nach dem Mittelwertsatz existiert stets ein mit , so daß
also ist
für alle
und damit
für beliebige
.
Beispiel. Es sei , wobei
und .
Folglich ist in den Gebieten
,
,
,
definiert und offenbar differenzierbar. In jedem der Gebiete gilt:
Folglich ist , und damit ist in jedem der konstant. Die Werte von kann man leicht durch geeignete spezielle Argumente ermitteln.
In ist ,
in ist ,
in ist ,
in ist .
Es soll jetzt der Taylorsche Satz für Funktionen mit mehreren Veränderlichen verallgemeinert werden. Dies erfordert einen gewissen technischen Aufwand, den wir durch eine geeignete Schreibweise etwas reduzieren wollen.
Definition. Es sei und in definiert.
(1) heißt in stetig differenzierbar =Df
(2) ist in -mal stetig differenzierbar =Df
Es sei jetzt eine offene Teilmenge von und . Weiterhin seien , wobei und die Verbindungsstrecke ganz zu gehöre. Dann ist
für
eine reellwertige Funktion einer reellen Veränderlichen, deren Ableitung sich gemäß der Kettenregel wie folgt berechnet
Für bzw. schreiben wir kurz bzw. . Damit ergibt sich
wobei das Argument von der Einfachheit halber weggelassen wurde.
Für ist dann
Nach dem Satz von Schwarz ist und somit erhält man für
In Analogie zur binomischen Formel schreiben wir für im folgenden auch .
Analog erhält man für , die Darstellung
(Beweis induktiv über )
Ist offen, und sind mit und Elemente aus , deren Verbindungsstrecke ganz zu gehört, und ist dann ist
Schreibt man für so erhält man
und
wenn man den Satz von Schwarz und eine der binomischen Formel (für Summanden) analoge Schreibweise benutzt.
Induktiv zeigt man schließlich
Jetzt sind wir in der Lage, den Taylorschen Satz in übersichtlicher Weise zu formulieren.
Satz 8.12 Satz von Taylor für Funktionen mit Veränderlichen Sei eine offene Umgebung von und . Sei , so daß die Verbindungsstrecke von und ganz zu gehört. Für gilt dann Es gibt ein mit , so daß wobei
Beweis. Sei . Dann ist als reellwertige Funktion einer reellen Veränderlichen offenbar -mal differenzierbar. Nach dem Taylorschen Satz für Funktionen einer Veränderlichen gibt es ein mit , so daß
Es ist
für und
Hieraus folgt die Behauptung.
Korollar. (1)
(2)
(3)
Beweis. (1) und (2) sind
trivial; (3) zeigt man wie im eindimensionalen Fall.
Beispiel. Sei und . Dann ist und . Folglich ist beliebig oft stetig partiell differenzierbar und es ist und somit insbesondere für .
Wegen und gilt
(Man hätte diese Reihe natürlich auch anders gewinnen können.)
Wir befassen uns jetzt mit lokalen Extrema bei Funktionen mit zwei und mehr Veränderlichen.
In den Sätzen 7.15 und 7.16 sind (für differenzierbare Funktionen mit einer Veränderlichen) gewisse Bedingungen für das Vorliegen eines lokalen Extremums an einer Stelle angegeben worden; und zwar eine notwendige Bedingung: und eine hinreichende Bedingung: .
Ähnliche, wenn auch kompliziertere, Bedingungen gibt es auch für Funktionen mit zwei (und mehr) Veränderlichen, mit denen wir uns jetzt befassen.
Definition. (lokales Extremum) Sei und ein innerer Punkt von . besitzt an der Stelle ein relatives oder lokales Extremum (:= lokales Minimum bzw. lokales Maximum) =Df
Satz 8.13 Notwendige Bedingung für die Existenz eines lokalen Extremums Sei in einer Umgebung von definiert und in nach allen Variablen partiell differenzierbar. Besitzt in ein lokales Extremum, dann sind alle (ersten) partiellen Ableitungen von in null. (Wenn für , also , dann heißt auch kritischer oder stationärer Punkt von .)
Beweis. Habe o.B.d.A. in ein lokales Minimum (für ein lokales Maximum verläuft der Beweis analog). Dann gibt es eine Umgebung , so daß für jedes mit gilt: . Dies gilt insbesondere für , wenn hinreichend klein ist.
Nach Voraussetzung ist die Funktion (als Funktion von ) in differenzierbar, und es ist Offenbar besitzt (als Funktion einer Veränderlichen) in ein lokales Minimum. Folglich gilt nach Satz 7.15:
für
.
Beispiel. Sei . Wir berechnen die kritischen Stellen von . Es ist
und
Die einzige kritische Stelle ist . Höchstens dort kann ein lokales Extremum besitzen.
Im eindimensionalen Fall haben wir eine hinreichende Bedingung für das Vorliegen eines lokalen Extremums mit Hilfe des Taylorschen Satzes bewiesen. Analoge Überlegungen führen auch bei Funktionen mit mehreren Veränderlichen zum Ziel. Wir beschränken uns hier auf Funktionen mit zwei Veränderlichen, da der technische Aufwand für den -dimensionalen Fall nicht unerheblich ist.
Ist eine Umgebung von zweimal stetig differenzierbar in und hinreichend dicht bei , dann gilt nach dem Satz von Taylor (für und )
Sind die notwendigen Bedingungen für das Vorliegen eines lokalen Extremums erfüllt, d.h., , dann erhält man
Ob an der Stelle ein lokales Extremum besitzt, hängt allein von dem Restglied ab. Aufgrund der Stetigkeit der zweiten partiellen Ableitungen in wechseln diese in einer hinreichend kleinen Umgebung von ihr Vorzeichen nicht, falls sie an der Stelle von null verschieden sind. Dies nutzen wir aus, um ein handhabbares Kriterium zur Verfügung zu haben.
Satz 8.14 Hinreichende Bedingung für die Existenz eines lokalen Extremums Es sei und sei in einer Umgebung von zweimal stetig differenzierbar. Weiterhin sei ein kritischer Punkt von und Dann gilt
Beweis. Wir benutzen die gleichen Bezeichnungen wie in der obigen Formel . Da nach Voraussetzung und null sind, erhält man aus
(1). Nach Voraussetzung ist
Betrachtet man als Funktion von , dann ist wegen die Funktion in stetig und somit , falls hinreichend nahe bei liegt.
Analog gilt für auch
Im folgenden schreiben wir für kurz .
Da nicht null ist, erhält man
Da der Ausdruck in den eckigen Klammern für positiv ist, hängt das Vorzeichen von nur von ab. (Für gilt nach schon .)
Also für besitzt an der Stelle ein lokales Minimum und für ein lokales Maximum.
(2). Sei . Setzt man bzw. , dann erhält man
bzw.
Es sei zunächst . Wegen ist dann und somit
Dies bedeutet, daß in jeder Umgebung von sowohl positive als auch negative Werte von auftreten. Folglich besitzt in kein lokales Extremum.
Es bleibt noch der Fall zu betrachten, daß oder .
Sei o.B.d.A. . Dann erhält man für
Für hinreichend nahe bei gelegene haben und das gleiche Vorzeichen.
Sei jetzt und für „kleine“ Dann gilt
Wegen gilt
Folglich haben
und
unterschiedliches Vorzeichen, und damit besitzt
in
kein lokales Extremum.
Den Fall
beweist man durch
ähnliche Überlegungen.
Die folgende Abbildung zeigt eine Funktion mit Sattelpunkt.
In den Quadranten, in denen und jeweils nur positive bzw. nur negative Werte annehmen, ist die Funktion stets negativ, in den Quadranten, wo jeweils ein Wert positiv und ein Wert negativ ist, ist die Funktion positiv. Entlang der -Achse und der -Achse ist die Funktion stets null. Die dargestellte Fläche läßt sich offenbar allein durch Geraden erzeugen.
Wir fahren jetzt fort mit der Untersuchung unseres Beispiels. Hierzu benutzen wir das oben erhaltene Kriterium.
Offenbar sind die zweiten partiellen Ableitungen an der kritischen Stelle stetig. Denn es ist
und damit gilt
Wegen besitzt in ein lokales Extremum (vgl. auch Abb. 8.5 und Abb. 8.8 b).
Wir betrachten jetzt das Beispiel .
Die folgende Abbildung zeigt diese Funktion; sie stellt ebenfalls eine Sattelfläche dar, die an der Stelle einen Sattelpunkt besitzt.
Es ist
Dann ist wieder ein kritischer Punkt von , aber
folglich besitzt in einen Sattelpunkt.
Bemerkung. Nach unserer Definition sind die Extremstellen einer Funktion immer innere Punkte des betrachteten Definitionsbereiches (man kann dies auch anders definieren !). Ist man nicht nur an lokalen sondern auch an absoluten (oder globalen) Extrema (im Gegensatz zu lokalen Extremstellen) interessiert, dann muß noch der Teil des Randes des Definitionsbereiches untersucht werden, der selbst zum Definitionsbereich gehört. Schränkt man die Funktion auf den betreffenden Teil des Randes ein, dann erhält man (in Abhängigkeit von der Kompliziertheit des Randes) oft eine „handhabbare“ Funktion mit einer Veränderlichen. Die lokalen und globalen Extrema für (falls solche existieren) müssen dann mit den lokalen Extrema von verglichen werden.
8.4 Implizite Funktionen
In diesem Abschnitt befassen wir uns mit der (nicht einfachen Problematik der) Auflösbarkeit von Gleichungssystemen. Die lineare Algebra stellt bekanntlich gut nutzbare Werkzeuge für die Auflösung von linearen Gleichungssystemen bereit. Diese Hilfsmittel versagen jedoch im nichtlinearen Fall. Zur Verdeutlichung der Auflösbarkeit solcher Systeme starten wir mit einem linearen Gleichungssystem, das gegeben ist durch
, wobei , , .
Das Gleichungssystem ist bekanntlich genau dann lösbar (d.h. nach auflösbar), wenn der Rang der Koeffizientenmatrix mit dem der erweiterten Koeffizientenmatrix übereinstimmt. Für den Fall, daß und der Rang von ebenfalls ist (d.h. die Determinante det von nicht null ist), läßt sich das Gleichungssystem stets eindeutig lösen. Ist das Gleichungssystem lösbar, und (nach eventueller Umsortierung der Koeffizienten)
,
dann gibt es lineare Funktionen , so daß
für .
Für und erhält man somit
Wir befassen uns jetzt mit beliebigen Gleichungssystemen. Dazu betrachten wir zunächst eine Gleichung mit zwei Unbekannten.
Definition. (Implizit definierte Funktion) Sei und in einer Umgebung definiert und . Weiterhin seien , jedoch so klein, daß .
Durch die Gleichung ist in der Umgebung eine Funktion implizit definiert =Df
Beispiel. Sei .
definiert in eine Kreislinie mit dem Radius 1 und dem Mittelpunkt (0,0).
Sei und , dann ist ein Punkt der Kreislinie. Für und gibt es ein , so daß für jedes genau ein existiert mit . In diesem Fall ist .
Satz 8.15 Hauptsatz über implizite Funktionen mit zwei Veränderlichen Voraussetzung Sei eine offene Menge und stetig in . Sei und .
Beweis. Da und in stetig ist, gibt es eine Umgebung , so daß dort stets positiv oder stets negativ ist. Sei o.B.d.A. ( analog).
Wir wählen jetzt , jedoch so klein, daß .
Da für alle , ist in streng monoton wachsend. Sei und . Wegen ist . Da als Funktionen von stetig sind, gibt es ein mit , so daß für jedes gilt: .
Für ist also in stetig und
Nach dem Zwischenwertsatz (für Funktionen einer Veränderlichen) gibt es ein , so daß .
Da in stets positiv ist, erhält man insbesondere . Folglich ist streng monoton wachsend und somit das einzige Element in mit . Durch für ist eine Funktion definiert.
Es bleibt noch zu zeigen, daß in stetig ist.
Sei (wie oben) und , jedoch so klein, daß und . Nach den vorhergehenden Betrachtungen existiert für genau ein , so daß , also .
Damit erhält man
Hieraus folgt die Stetigkeit von
in
.
Korollar. Gilt zusätzlich zu den Voraussetzungen von Satz 8.15 noch (4) ist in stetig partiell nach differenzierbar, dann ist die durch in implizit definierte Funktion differenzierbar, und es gilt .
Beweis. Wir wählen die Bezeichnungen wie im vorhergehenden Beweis. Sei und , dann ist , und die Verbindungsstrecke zwischen und gehört ganz zu . Nach dem Mittelwertsatz für Funktionen mit mehreren Veränderlichen gilt (er kann hier angewendet werden, da nach Voraussetzung differenzierbar ist):
wobei und . Hieraus folgt
.
Da in stetig ist, gilt für auch und somit . Folglich existiert
,
also
.
Beispiel. Es sei .
Für gelten die folgenden Voraussetzungen:
1. ist in einer Umgebung mit stetig. 2. . 3. ist in stetig partiell nach differenzierbar und .
Nach dem Satz über implizite Funktionen gibt es dann eine stetige Funktion , für die gilt:
Für jedes gibt es ein , so daß für alle genau ein existiert mit und .
Offenbar ist auch stetig partiell nach differenzierbar. Damit ist (nach dem letzten Korollar) in differenzierbar und
.
Hierbei entsteht eine Gleichung, die eine unbekannte Funktion und deren Ableitung enthält. (Gleichungen dieser Art heißen Differentialgleichungen.)
Abschließend soll noch der Hauptsatz über implizite Funktionen mit mehreren Veränderlichen ohne Beweis angegeben werden. (Siehe hierzu Literaturangabe [4], Teil II, Seite 235 – 242.)
Dazu benötigen wir noch die folgende Definition.
Definition. (implizit definierte Funktionen mit mehreren Veränderlichen) Sei und in einer Umgebung definiert und . Weiterhin seien , jedoch so klein, daß .
Durch die Gleichung ist in der Umgebung eine Funktion implizit definiert =Df
Satz 8.16 Hauptsatz über implizite Funktionen Voraussetzung
Behauptung
Es gibt eine stetige Funktion , für die gilt Für jedes gibt es ein , so daß für jedes genau ein existiert mit und (insgesondere ist ).
Beweis. Siehe
Literaturangabe [4], Teil II, Seite 235.
Schwerpunkte für die Wiederholung von Kapitel 8