Ausblick: Die λ-Formulierung der Konvexität
Wir diskutieren eine Formulierung der Konvexität, die oft zur Definition verwendet wird. Hierzu nutzen wir, dass jedes Intervall [ x1, x2 ] die folgende baryzentrische Darstellung besitzt:
[ x1, x2 ] = { (1 − λ) x1 + λ x2 | 0 ≤ λ ≤ 1 }
Zur baryzentrischen Darstellung des Intervalls [ x0, x1 ]:
Das Intervall wird in λ ∈ [ 0, 1 ] gleichmäßig von links nach rechts durchlaufen.
Satz (Lambda-Konvexität)
Sei f : I → ℝ. Dann sind äquivalent:
(a) | f ist konvex. |
(b) | Für alle x1 < x2 in I und alle λ ∈ [ 0, 1 ] gilt: f ((1 − λ) x1 + λ x2) ≤ (1 − λ) f (x1) + λ f (x2). |
Eine analoge Äquivalenz gilt für konkave Funktionen und weiter für die strengen Versionen der Konvexität und Konkavität (mit λ ∈ ] 0, 1 [).
Beweis
Seien x1 < x2 in I. Wir definieren Geraden g, h : ℝ → ℝ durch
g(λ) = (1 − λ) x1 + λ x2,
h(λ) = (1 − λ) f (x1) + λ f (x2) für alle λ ∈ ℝ.
Dann gilt
fx1, x2 ∘ g = h.
Denn die Funktionen fx1, x2 ∘ g und h sind jeweils Geraden durch (x1, f (x1)) und (x2, f (x2)). Damit ist
f ≤ fx1, x2 auf [ x1, x2 ] = g[ [ 0, 1 ] ]
äquivalent zu
f ∘ g ≤ fx1, x2 ∘ g = h auf [ 0, 1 ].
Damit sind die Konvexität von f und die Aussage (b) äquivalent.
Die Lambda-Formulierung der Konvexität erlaubt die folgende Verallgemeinerung auf n Punkte x1, …, xn:
Satz (Jensen-Ungleichung)
Sei I ein Intervall, und sei f : I → ℝ konvex. Weiter seien λ1, …, λn > 0 mit λ1 + … + λn = 1. Dann gilt für alle x1, …, xn ∈ I:
f (λ1 x1 + … + λn xn) ≤ λ1 f (x1) + … + λn f (xn).
Ist f streng konvex, so gilt Gleichheit genau dann, wenn x1 = … = xn.
Eine analoge Aussage gilt mit „≥“ statt „≤“ für konkave Funktionen.
Der Beweis sei dem Leser überlassen. Als Anwendung der Ungleichung zeigen wir hier noch:
Satz (arithmetisches und geometrisches Mittel)
Seien λ1, …, λn ≥ 0 mit λ1 + … + λn = 1. Dann gilt für alle x1, …, xn > 0:
x1λ1 · … · xnλn ≤ λ1 x1 + … + λn xn.
Speziell ist das geometrische Mittel der Zahlen λ1, …, λn kleinergleich ihrem arithmetischen Mittel, d. h.
n ≤ x1 + … + xnn.
Beweis
Seien x1, …, xn > 0. Da die Funktion log : ] 0, ∞ [ → ℝ konkav ist, gilt
log(λ1 x1 + … + λn xn) ≥ λ1 log(x1) + … + λn log(xn).
Aufgrund der Monotonie der Exponentialfunktion ist dann
λ1 x1 + … + λn xn | = exp(log(λ1 x1 + … + λn xn)) |
≥ exp(λ1 log(x1) + … + λn log(xn)) | |
= x1λ1 · … · xnλn. |
Der Zusatz entspricht dem Spezialfall λ1 = … = λn = 1/n.
Der Unterschied des geometrischen und arithmetischen Mittels für n = 2.
Dargestellt ist die Funktion f : [ 0, ∞ [ × [ 0, ∞ [ → ℝ mit
f(x, y) = x + y2 −