1. Grundlagen

Die Axiome von ZFC

Georg Cantor entwickelte seine unendliche Mengenlehre in den letzten drei Jahrzehnten des 19. Jahrhunderts. Drei weitere Jahrzehnte hat es dann gedauert, bis die von Ernst Zermelo 1908 ins Leben gerufene axiomatische Mengenlehre zur Reife gelangte. Das Resultat ist ein Axiomensystem, das in der  ∈ -Sprache der Prädikatenlogik erster Stufe formuliert und mit einem formalen Beweisbegriff unterlegt ist. Das System besteht aus den folgenden Axiomen, die wir sowohl in der mathematischen Umgangssprache als auch in der Epsilon-Sprache formulieren.

Extensionalitätsaxiom (Ext)

Zwei Mengen sind genau dann gleich, wenn sie die gleichen Elemente haben.

∀x, y. x = y ↔ ∀z. z  ∈  x ↔ z  ∈  y

Existenz der leeren Menge (LM)

Es gibt eine Menge, die keine Elemente enthält.

∃x ∀y y  ∉  x

Paarmengenaxiom (Pa)

Zu je zwei Mengen x, y existiert eine Menge z, die genau x und y als Elemente hat.

∀x, y ∃z ∀u. u  ∈  z ↔ u = x ∨ u = y

Vereinigungsmengenaxiom (Ver)

Zu jeder Menge x existiert eine Menge y, deren Elemente genau die Elemente der Elemente von x sind.

∀x ∃y ∀z. z  ∈  y ↔ ∃u. u  ∈  x ∧ z  ∈  u

Potenzmengenaxiom (Pot)

Zu jeder Menge x existiert eine Menge y, die genau die Teilmengen von x als Elemente besitzt.

∀x ∃y ∀z. z  ∈  y ↔ ∀u. u  ∈  z → u  ∈  x

Aussonderungsschema (Aus)

Zu jeder Eigenschaft φ und jeder Menge x gibt es eine Menge y, die genau die Elemente von x enthält, auf die φ zutrifft.

∀x, p₁, . . . , p_n ∃y ∀u. u  ∈  y ↔ u  ∈  x ∧ φ(u, p₁, . . . , p_n)

Ersetzungsschema (Ers))

Das Bild einer Menge unter einer Funktion φ ist eine Menge.

∀p₁, . . . , p_n. ∀u ∃!v φ(u, v, p₁, . . . , p_n) →

∀x ∃y ∀v. v  ∈  y ↔ ∃u. u  ∈  x ∧ φ(u, v, p₁, . . . , p_n)

Unendlichkeitsaxiom (Un)

Es gibt eine Menge x, die die leere Menge als Element enthält und die mit jedem ihrer Elemente y auch diejenige Menge z als Element enthält, deren Elemente genau die Elemente von y sowie y selbst sind.

∃x. (∃y. y  ∈  x ∧ ∀z z  ∉  y) ∧ ∀y  ∈  x ∃z  ∈  x ∀u. u  ∈  z ↔ u  ∈  y ∨ u = y

Fundierungsaxiom (Fun)

Jede nichtleere Menge x hat ein Element y, das mit x kein Element gemeinsam hat.

∀x. ∃y y  ∈  x → ∃y  ∈  x ∀z  ∈  y z  ∉  x

Auswahlaxiom (AC für „Axiom of Choice“)

Ist x eine Menge, deren Elemente nichtleer und paarweise disjunkt sind, so existiert eine Menge y, die mit jedem Element von x genau ein Element gemeinsam hat.

∀x. (∀y  ∈  x ∃z z  ∈  y ∧ ∀y  ∈  x ∀z  ∈  x. y ≠ z → ∀u  ∈  y u  ∉  z) →

∃y ∀z  ∈  x ∃!u. u  ∈  y ∧ u  ∈  z

Auf etwa einer Buchseite lässt sich also eine Axiomatisierung für die unendliche Mengenlehre angeben, die als Fundament für die gesamte moderne Mathematik dienen kann und, in Folge breiter Akzeptanz, auch dient. Die Geschichte hinter dieser Seite ist dabei ebenso komplex wie die in ihr verdichtete Information. Der Mengenbegriff musste entdeckt und in seinem mathematischen Reichtum erkannt werden. Eine umgangssprachliche Axiomatisierung der Mengenlehre musste gefunden werden. Die mathematische Logik musste soweit entwickelt werden, dass sie die Präzisierung der Axiomatik leisten konnte. Der Mengenbegriff musste in seiner interpretativen Kraft erkannt werden, denn es war zu Beginn weder klar noch intendiert, dass sich jedes mathematische Objekt als Menge auffassen lässt. Hinzu kommt die allgemeine Verbreitung und Diskussion des Systems, bei der auch die Stimmung und Grundhaltung einer Epoche eine wichtige Rolle gespielt hat. Kurz: Obiges System und seine Akzeptanz ist das Ergebnis eines verwickelten wissenschaftlichen, historischen und auch soziologischen Prozesses, und das „Wiegen“, das am Ende des etymologischen Pfades von „Axiom“ steht, ist hier besonders greifbar. Ein Großteil der historisch einflussreichen Dokumente stammt dabei aus dem späten 19. und frühen 20. Jahrhundert und liegt zudem im Original auf Deutsch vor, sodass der Leser dieses Textes ohne größere zeitliche und sprachliche Hindernisse zurückblicken kann, wenn er das System aus kultureller und damit letztendlich auch mathematischer Sicht besser verstehen möchte. Wir blicken in diesem Buch nach vorne und verweisen den Leser auf die „Einführung“ für einen Zugang zur Mengenlehre, der die andere Blickrichtung zu integrieren versucht hat.

Obige Axiomatik bezeichnen wir mit ZFC für „Zermelo-Fraenkel-Axiomatik mit Auswahlaxiom“. Das „C“ steht hierbei für das Auswahlaxiom (AC), engl. „axiom of choice“. ZF sei die Axiomatik ZFC ohne das Auswahlaxiom. Symbolisch schreiben wir:

ZFC = (Ext) + (LM) + (Pa) + (Ver) + (Pot) + (Aus) + (Ers) + (Un) + (Fun) + (AC),

ZF = ZFC − (AC).

Das Unendlichkeitsaxiom des Systems ist bereits auf die Definition einer Ordinalzahl nach von Neumann und Zermelo zugeschnitten. (Vgl. Zermelos ursprüngliches Axiom (Un) und die Diskussion zu Zermelos Zahlreihe in der „Einführung“, 3. 1 ; dort hatten wir obiges Axiom mit (Un2) bezeichnet.)

Einige Axiome von ZFC sind redundant. So folgt die Existenz der leeren Menge aus dem Aussonderungsschema und das Aussonderungsschema selbst lässt sich, wie wir sehen werden, aus dem Ersetzungsschema herleiten. Dennoch hat das Aussonderungsschema seinen festen Platz in der Theorie. Es ist leicht verständlich und wird von Beginn an gebraucht, während die Kraft des stärkeren Ersetzungsschemas erst später ans Licht kommt.

Die Redundanzen in unserem System halten sich andererseits auch wieder in Grenzen. Wir werden im zweiten Abschnitt bei der Diskussion des Reflexionsprinzips zeigen, dass sich ZFC nicht endlich axiomatisieren lässt, d. h. es gibt kein zu ZFC äquivalentes System, das aus einer endlichen Liste von Axiomen besteht (vorausgesetzt, ZFC ist widerspruchsfrei).

Im ersten Abschnitt des Buches untersuchen wir die Axiomatik ZFC und achten dabei auch auf den Einsatz und das Zusammenspiel der einzelnen Axiome. Wir werden dabei aber keineswegs genau mitschreiben, welche Axiome für welche Konstruktionen und Argumente letztendlich gebraucht werden. Lediglich das Ersetzungsschema, das Fundierungsaxiom und das Auswahlaxiom werden in der Diskussion besonders hervorgehoben, und der reduzierte Grundstock unserer Axiomatik ist damit die Theorie

Z = ZFC − (Ers) − (Fun) − (AC),

also die formalisierte Form von Zermelos erster Axiomatik von 1908 ohne das dortige Auswahlaxiom. Die formalisierte originale Zermelo-Axiomatik bezeichnen wir in diesem Buch mit ZC, sodass also ZC = Z + (AC) = ZFC − (Ers) − (Fun).

Die Axiome von ZFC nennen wir auch die Basisaxiome der Mengenlehre. Diese Wortwahl deutet bereits auf mögliche Erweiterungen des Systems hin, und im Laufe unserer Untersuchungen werden wir auch eine Reihe von interessanten und sich zum Teil widersprechenden Aussagen kennen lernen, um die ZFC erweitert werden könnte. Diese Aussagen nennen wir „Prinzipien“, „Vermutungen“, „Hypothesen“ und zum Teil auch „Axiome“, ohne dadurch anzudeuten, dass wir sie tatsächlich in unser System mit aufnehmen oder den Basisaxiomen gleichstellen wollen. In vielen Fällen haben auch die Mathematiker, die diese Prinzipien entdeckten und zuerst untersuchten, keine Tendenz ausgesprochen. Entsprechend soll z. B. mit der Bezeichnung „Suslin-Hypothese“ nicht suggeriert werden, dass Suslin diese Aussage für richtig hielt. Eine Ausnahme bildet die Kontinuumshypothese, die von Cantor als wahr eingeschätzt wurde.

Überblick über die Rolle der Axiome

Das Extensionalitätsaxiom klärt die Elementrelation. Mengen sind durch ihre Elemente bestimmt und durch nichts sonst. Aus rein logischen Gründen gilt: Sind zwei Mengen gleich, so haben sie dieselben Elemente. Es wäre also nicht notwendig, diese Implikation in (Ext) zu fordern.

Die Axiome (LM), (Pa), (Ver) sind grundlegende und einfache Existenzaxiome, die durchgehend im Einsatz sind.

Das Potenzmengenaxiom ist ein in Verbindung mit dem Unendlichkeitsaxiom sehr starkes, ja gewagtes und kühnes Axiom. Es führt zu einer Flut von verschiedenen Unendlichkeitsstufen, den transfiniten Mächtigkeiten. In der allgemeinen Mathematik ist es bei der Konstruktion des klassischen mathematischen Kontinuums unentbehrlich. Die reellen Zahlen gehen aus der Potenzmenge der natürlichen Zahlen hervor.

Das aus unendlich vielen Axiomen bestehende Aussonderungsschema erlaubt sehr freie Konstruktionen von Mengen, und das Schema ist ebenfalls von Beginn an im Einsatz. Innerhalb einer gegebenen Menge können wir alle Mengen mit einer bestimmten Eigenschaft zu einer neuen Menge zusammenfassen. Dass hier eine Einschränkung wie „innerhalb einer gegebenen Menge“ notwendig ist, zeigen die Paradoxien des widersprüchlichen allgemeinen Komprehensionsschemas, das uns erlauben würde, alle Mengen mit einer bestimmten Eigenschaft zu einer neuen Menge zusammenzufassen. Die einfachste Paradoxie der uneingeschränkten Komprehension ist die Russell-Zermelo-Paradoxie der Menge aller Mengen, die sich selbst nicht als Element enthalten. Wir diskutieren die logische Natur dieser Paradoxie gleich noch genauer.

Das Ersetzungsschema wird zunächst gar nicht verwendet. Dafür ist es dann beim Beweis der Rekursionssätze und bei der Definition der Ordinalzahlen nach von Neumann und Zermelo unentbehrlich.

Das Unendlichkeitsaxiom setzen wir in der Entfaltung des Systems recht früh zur Gewinnung der Menge der natürlichen Zahlen ein. Es führt uns von der Arithmetik zur Mengenlehre − eine Sicht, die wir im siebten Kapitel genauer begründen werden.

Das Fundierungsaxiom wird wie das Ersetzungsschema zunächst nicht verwendet, spielt dann aber bei der Analyse des Mengenuniversums eine Schlüsselrolle. Mit seiner Hilfe können wir das Universum durch eine Hierarchie strukturieren, die alle Mengen erreicht, und das Axiom sorgt damit für ein klares Bild der Welt, die wir untersuchen, das „intendierte Modell“ der axiomatischen Mengenlehre. Es ist das einzige Axiom des Systems mit einem restriktiven Charakter.

Das Auswahlaxiom sorgt ebenfalls für klare Strukturen im Universum, die durch den äquivalenten Wohlordnungssatz vielleicht am deutlichsten werden. Zugleich hat es Konsequenzen, die zuweilen als unerwünscht oder unintuitiv empfunden werden, z. B. die Existenz einer nicht Lebesgue-messbaren Menge von reellen Zahlen oder die Existenz von Zerlegungen einer dreidimensionalen Kugel mit Durchmesser 1, deren Teile sich durch Translation und Rotation zu zwei Vollkugeln des Durchmessers 1 zusammenbauen lassen (Banach-Tarski-Paradoxon). Wir widmen diesem Axiom und seinen Varianten ein eigenes Kapitel.

Mengen und Klassen

Alle Objekte der Theorie sind Mengen. „Für alle x“ bedeutet also „für alle Mengen x“, und „sei x eine Menge“ ist nur eine Sprechweise für ein beliebiges Objekt x der Theorie. Wir nutzen aber an vielen Stellen die sog. Klassensprechweise, die uns den Komfort des mengentheoretischen Denkens und Notierens auf sprachlicher Ebene zur Verfügung stellt und so das Manipulieren von  ∈ -Formeln in vielen Fällen überflüssig macht.

Definition (Klassen)

Sei φ(x) eine Formel (mit Parametern). Dann heißt der Ausdruck

{ x | φ(x) } (Klassennotation)

die Klasse aller Mengen x, auf die die Eigenschaft φ zutrifft.

Offiziell sind Klassen also nichts anderes als formale Ausdrücke, die durch eine Formel der  ∈ -Sprache bestimmt sind. Wir werden sehen, wie wir Formeln, die Klassenausdrücke der Form { x | φ(x) } beinhalten, in reine  ∈ -Formeln umwandeln können. Intuitiv sind Klassen beliebig große sprachlich definierte Teilbereiche des Objektuniversums, und diese Sicht möchten wir beim Leser letztendlich auch unterstützen. Zuvor müssen wir aber die Verwendung von Klassen in einer formal korrekten Weise einführen.

Seien A = { x | φ(x) } und B = { x | ψ(x) } Klassen, a eine Menge, und sei χ(x) eine Formel. Dann definieren wir:

a  ∈  A	als φ(a) ( ∈ -Relation zwischen Menge und Klasse)
A = B	als ∀x. x  ∈  A ↔ x  ∈  B (Gleichheit zweier Klassen)
a = A	als ∀x. x  ∈  a ↔ x  ∈  A (Gleichheit von Menge und Klasse)
A = a	als a = A (Gleichheit von Klasse und Menge)
A  ∈  a	als ∃x  ∈  a x = A ( ∈ -Relation zwischen Klasse und Menge)
A  ∈  B	als ∃x. x  ∈  B ∧ x = A ( ∈ -Relation zwischen zwei Klassen)

∀x  ∈  A χ(x) als ∀x. x  ∈  A → χ(x)

∃x  ∈  A χ(x) als ∃x. x  ∈  A ∧ χ(x) (beschränkte Klassenquantoren)

Diese Ausdrücke können wir nun frei verwenden, ohne die  ∈ -Sprache zu verlassen. Ist A = { x | φ(x) }, so bedeutet die neue  ∈ -Formel „x  ∈  A“ per Definition nichts anderes als φ(x). Wir lesen „x  ∈  A“ als „x ist ein Element der Klasse A“. Gilt x  ∈  A, so ist x ein Objekt der Theorie, also eine Menge.

Mit Klassen lassen sich mengentheoretische Operationen durchführen, ohne dabei die definierenden Formeln zu erwähnen. Klassen tendieren dazu, sich zu verselbstständigen, und dies ist gewollt. Zum Beispiel definieren wir für beliebige Klassen A und B:

A ⊆ B als ∀x  ∈  A x  ∈  B, (A ist Teilklasse von B)

Dann können wir zum Beispiel beweisen:

(+)	Für alle Klassen A und B gilt: A = B ↔ A ⊆ B ∧ B ⊆ A.

Diese Aussage ist „offiziell“ das rein logisch beweisbare Theoremschema:

(+)′	Für alle Formeln φ(x) und ψ(x) gilt:
	∀x (φ(x) ↔ ψ(x)) ↔ ∀x (φ(x) → ψ(x)) ∧ ∀x (ψ(x) → φ(x)).

Formulierungen der Form (+) wird man schnell lieb gewinnen und man wird dann auf die oftmals schwerfälligen Übersetzungen der Form (+)′ verzichten wollen. Ein Beispiel ist die Transitivität der Teilklassen-Relation:

A ⊆ B ∧ B ⊆ C → A ⊆ C.

Wir definieren noch einige häufig verwendete Operationen für beliebige Klassen A, B:

A ∩ B	= { x \| x  ∈  A ∧ x  ∈  B } (Durchschnitt zweier Klassen)
A ∪ B	= { x \| x  ∈  A ∨ x  ∈  B } (Vereinigung zweier Klassen)
A − B	= { x \| x  ∈  A − x  ∈  B } (Differenz zweier Klassen)
A Δ B	= (A − B) ∪ (B − A) (symmetrische Differenz zweier Klassen)
⋃ A	= { x \| ∃y  ∈  A x  ∈  y } (Vereinigung einer Klasse)
⋂ A	= { x \| ∀y  ∈  A x  ∈  y } (Durchschnitt einer Klasse)
℘(A)	= { x \| x ⊆ A } (Potenzklasse einer Klasse)

Beispiele für beweisbare Klassenaussagen

A ∩ B ⊆ A, A ∩ A = A, A ∩ B = B ∩ A

A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

(A Δ B) Δ C = A Δ (B Δ C)

Viele Klassennotationen folgen den üblichen Notationen für Mengen. Sind A und B Klassen und a₁, …, a_n Mengen, so definieren wir

{ x  ∈  A \| x  ∈  B }	als { x \| x  ∈  A ∧ x  ∈  B } (Klassenaussonderung)
{ a₁, …, a_n }	als { x \| x = a₁ ∨ … ∨ x = a_n } (Angabe der Elemente)
{ }	als { x \| x ≠ x } (leere Klasse)

Wir schreiben auch ∅ für die leere Klasse.

Wir verweisen den Leser auf den Anhang dieses Buches für eine Liste von Definitionen und Notationen im Umfeld der Klassensprechweise. (Vgl. weiter auch „Einführung“, 3. 3.)

Dem Leser wird aufgefallen sein, dass wir bislang keine mengentheoretischen Axiome verwendet haben. Die Etablierung der Klassensprechweise ist eine rein definitorische Angelegenheit.

Mengen als Klassen

Jede Menge können wir als eine Klasse auffassen:

Satz (Mengen als Klassen)

Für alle Mengen a gilt a = { x | x  ∈  a }.

Beweis

Sei A = { x | x  ∈  a } die durch φ(x) = „x  ∈  a“ (mit a als Parameter) definierte Klasse. Nach Definition von a = A ist zu zeigen: ∀x. x  ∈  a ↔ x  ∈  A.

Dies ist aber trivial, da x  ∈  A nach Definition identisch ist mit x  ∈  a.

Das Extensionalitätsaxiom führt weiter dazu, dass die Klassenlesart von Mengen die Gleichheit nicht abschwächt. Sind nämlich a und b Mengen, so können wir „a = b“ lesen als { x | x  ∈  a } = { x | x  ∈  b }, was nach Definition der Gleichheit von Klassen gleichbedeutend ist mit ∀x. x  ∈  a ↔ x  ∈  b. Nach dem Extensionalitätsaxiom ist dies aber gleichwertig zu a = b. Insgesamt sind alle möglichen Lesarten von a = b und a  ∈  b − z. B. als a = { x | x  ∈  b } und { x | x  ∈  a }  ∈  b − gleichwertig zu den originalen  ∈ -Formeln.

Definitionen, Notationen und Ergebnisse über Klassen übertragen sich damit automatisch auf Mengen. Haben wir zum Beispiel A ⊆ B wie oben für Klassen definiert, so haben wir auch die Teilmengenrelation a ⊆ b eingeführt. Denn ist wieder A = { x | φ(x) } und B = { x | ψ(x) }, so ist nach Definition A ⊆ B gleichwertig zu ∀x. φ(x) → ψ(x). Für die Klassen a = { x | x  ∈  a } und b = { x | x  ∈  b } ist damit a ⊆ b eingeführt als ∀x. x  ∈  a → x  ∈  b.

Klassen als Mengen

Wir haben gesehen, dass jede Menge als eine Klasse aufgefasst werden kann. Umgekehrt sind viele Klassen auch Mengen:

Definition (Klassen als Mengen)

Sei A eine Klasse. Wir sagen: „A ist eine Menge“ falls gilt: ∃a a = A.

Eine suggestive Lesart für „A ist eine Menge“ erhalten wir durch Betrachtung der umfassendsten Klasse überhaupt:

Definition (Allklasse, Universum, V)

Wir definieren:

V = { x | x = x }.

Die Klasse V heißt die Allklasse oder das mengentheoretische Universum.

Es gilt nun:

Satz (Klassen als Mengen)

Sei A eine Klasse. Dann gilt: „A ist eine Menge“ gdw A  ∈  V.

Beweis

„A ist eine Menge“ gdw ∃a a = A gdw ∃a. a = a ∧ a = A gdw

∃a. a  ∈  V ∧ a = A gdw A  ∈  V.

Wir können nun viele Axiome von ZFC so lesen, dass sie behaupten, dass bestimmte Klassen Mengen sind:

„Element von V“-Formulierungen der Existenzaxiome von ZF

{ }  ∈  V (Existenz der leeren Menge)

∀a, b { a, b }  ∈  V (Paarmengenaxiom)

∀a { x | ∃y  ∈  a x  ∈  y }  ∈  V (Vereinigungsmengenaxiom)

∀a { x | x ⊆ a }  ∈  V (Potenzmengenaxiom)

∀a { x  ∈  a | φ(x) }  ∈  V (Aussonderungsschema)

∀a { y | x  ∈  a ∧ φ(x, y) }  ∈  V (Ersetzungsschema)

Hier unterdrücken wir die Parameter in den beiden Schemata. Weiter ist φ im Ersetzungsschema eine funktionale Formel, d. h. es gilt ∀x ∃!y φ(x, y).

Auch das Unendlichkeitsaxiom besitzt, wie wir sehen werden, eine äquivalente Formulierung der Form „A  ∈  V“. Wir können es zum Beispiel notieren als

{ x | x ist eine endliche Ordinalzahl }  ∈  V (Unendlichkeitsaxiom)

Damit bleibt nur noch das Auswahlaxiom unter den Existenzaxiomen von ZFC übrig. Dieses Axiom besitzt nun aber keine Formulierung der Form „A  ∈  V“ für eine bestimmte Klasse A (es sei denn, wir ergänzen ZFC um ein regulierendes Axiom wie „V = L“, vgl. Kapitel 2. 2). Das Auswahlaxiom ist damit ein ausgezeichnetes Existenzaxiom des Systems.

Ist A = { x | φ(x) }, so bedeutet die Aussage „A  ∈  V“, dass alle Objekte des Universums mit der Eigenschaft φ ein neues Objekt des Universums bilden. In der Sprechweise von Cantor: Die Zusammenfassung aller x mit der Eigenschaft φ(x) liefert ein Ganzes, eine konsistente Vielheit. Viele Axiome von ZFC sind damit Instanzen des allgemeinen Komprehensionsschemas, das jede Zusammenfassung erlaubt:

Komprehensionsschema (Kom)

Für jede Formel φ(x) (mit Parametern) gilt: { x | φ(x) }  ∈  V.

Die naive Mengenlehre lässt sich formalisieren als (Ext) + (Kom), evtl. erweitert um das Auswahlaxiom und weiter dann um das Fundierungsaxiom. Das Phänomen der echten Klassen − bei Cantor „inkonsistente Vielheiten“ genannt −, zeigt die Widersprüchlichkeit des vollen Komprehensionsschemas:

Echte Klassen

Klassen, die keine Mengen sind, nennen wir echte Klassen:

Definition (echte Klasse)

Eine Klasse A heißt echt, falls A  ∉  V.

Echte Klassen existieren aus rein logischen Gründen. Das wichtigste Beispiel ist hier:

Definition (Russell-Zermelo-Klasse, R)

Wir definieren:

R = { x | x  ∉  x }.

Die Klasse R heißt die Russell-Zermelo-Klasse oder kurz Russell-Klasse.

Während wir den Buchstaben V in diesem Text durchgehend für das mengentheoretische Universum verwenden, ist der Buchstabe R nur im Umfeld der Diskussion der echten Klassen fest belegt. Wir verwenden ihn später z. B. auch für Relationen.

Von zeitloser Bedeutung und Prägnanz ist:

Satz (über die Klasse R)

R ist eine echte Klasse.

Beweis

Für alle Mengen x gilt nach Definition von R:

(+) x  ∈  R gdw x  ∉  x.

Annahme, R ist eine Menge. Dann gilt also nach (+) für x = R:

R  ∈  R gdw R  ∉  R,

Widerspruch.

Das Argument ist rein logisch und verwendet keine Axiome von ZFC. Die Aussage „R ist keine Menge“ lautet formal:

¬ ∃x ∀y. y  ∈  x ↔ ¬(y  ∈  y).

Diese Aussage ist in der reinen Logik beweisbar. Denn gäbe es ein solches x, so hätten wir x  ∈  x ↔ ¬(x  ∈  x). Für dieses Argument wird nicht einmal das Extensionalitätsaxiom bemüht, und weiter auch nicht das tertium non datur der Logik, und die Argumentation ist damit vollkommen unstrittig. Statt der  ∈ -Relation kann hier ein beliebiges zweistelliges Relationssymbol ∗ eingesetzt werden.

In der Intuition von ZFC ist der durch eine echte Klasse bezeichnete Teilbereich des Universums zu groß, um eine Menge sein zu können. (Eine Präzisierung und Rechtfertigung dieser Intuition werden wir bei der Diskussion des Fundierungsaxioms und der V_α-Hierarchie geben.) Dass R eine echte Klasse ist, bedeutet bei dieser Lesart, dass es auch ohne Rückgriff auf das Fundierungsaxiom unbeschränkt viele Mengen x gibt mit x  ∉  x.

Nach dem Aussonderungsschema ist dann weiter auch das Universum V eine echte Klasse. Denn andernfalls wäre { x  ∈  V | x  ∉  x } = R als Aussonderung einer Menge wieder eine Menge. Ein anderes Argument benutzt das Fundierungs- und Paarmengenaxiom, um zu zeigen, dass die Klasse V keine Menge ist. Nach diesen Axiomen gilt x  ∉  x für alle x, da sonst die Menge { x } kein  ∈ -minimales Element besitzen würde. Es gilt dann also V = { x | x = x } = { x | x  ∉  x } = R, und damit ist V keine Menge.

Die Klasse R ist also eine echte Klasse in jeder Axiomatik der  ∈ -Sprache, und die Klasse V ist eine echte Klasse in einem schwachen Fragment von ZFC. Dass V eine echte Klasse ist, lässt sich nicht mehr rein logisch zeigen. Dies folgt erst aus der Interpretation von echten Klassen als „zu großen“ Zusammenfassungen: Das Universum V umfasst, unabhängig von der Gültigkeit des Fundierungsaxioms, die Klasse R, und ist also erst recht keine Menge. Mögliche andere Interpretationen von „echte Klasse“ könnten im Umfeld von „unabgeschlossen“, „generierend“, „negativ“ liegen, und es sind dann interessante Theorien denkbar, in denen das Universum V im Gegensatz zu seinem Teilbereich R ein Objekt der Theorie ist. Sicher gilt dann V = V und damit V  ∈  V.

Übung

Die Klassen A = { x | es gibt kein y mit x  ∈  y  ∈  x }, B = { x | es gibt keine y₁, y₂ mit x  ∈  y₁  ∈  y₂  ∈  x }, usw. sind echt.

[ Ähnlich wie für die Russell-Zermelo-Klasse ohne Verwendung von Axiomen. ]

Das Ersetzungsschema wird verwendet, um zu zeigen, dass eine Klasse, in die eine echte Klasse hineinprojiziert werden kann, echt sein muss:

Satz (Projektionssatz)

Sei φ(x, y) eine funktionale Formel wie im Ersetzungsschema, und weiter sei φ injektiv, d. h. für alle x₁, x₂, y gelte: φ(x₁, y) und φ(x₂, y) impliziert x₁ = x₂. Sei A eine echte Klasse, und sei B ⊇ { y | ∃x  ∈  A φ(x, y) }. Dann ist B echt.

Beweis

Annahme, B  ∈  V. Dann ist auch C = { y | ∃x  ∈  A φ(x, y) }  ∈  V (nach (Aus)).

Wir definieren eine Formel ψ(y, x) durch:

ψ(y, x) = „(y  ∈  C ∧ φ(x, y)) ∨ (y  ∉  C ∧ x = ∅)“.

Aufgrund der Injektivitätsvoraussetzung ist dann ψ(y, x) eine funktionale Formel. Wegen C  ∈  V ist also { x | ∃y  ∈  C ψ(y, x) }  ∈  V nach (Ers). Also ist

A = { x | ∃y  ∈  C φ(x, y) } = { x | ∃y  ∈  C ψ(y, x) }  ∈  V,

im Widerspruch zur Voraussetzung an A.

Beispielsweise ist also { { x } | x  ∈  V } eine echte Klasse.

Elementare Interpretationen

Die wichtigste elementare mengentheoretische Interpretation eines mathematischen Konzeptes ist die des geordneten Paares. Für Mengen a, b setzen wir:

(a, b) = { { a }, { a, b } }. (geordnetes Paar, Kuratowski-Paar)

Eine mehrfache Anwendung des Paarmengenaxioms zeigt, dass (a, b)  ∈  V. Denn zunächst sind x = { a } = { a, a }  ∈  V und y = { a, b }  ∈  V, und dann ist auch (a, b) = { x, y }  ∈  V.

Für alle Mengen a, b, c, d gilt (a, b) = (c, d) genau dann, wenn a = c und b = d. Diese Eigenschaft beinhaltet alles, was eine Definition des geordneten Paares erfüllen muss. Das Kuratowski-Paar ist aber dadurch ausgezeichnet, dass das Paar (a, b) nur mit Hilfe der Mengen a und b definiert wird. Es werden keine zusätzlichen Hilfsobjekte wie ∅ oder { ∅ } zur Markierung der Position von a und b verwendet.

Die Möglichkeit der Definition des geordneten Paares ist für die Mengenlehre von großer Bedeutung. Geordnete Paare werden überall gebraucht und es wäre ein großer Nachteil, wenn wir unsere Theorie erst um einen neuen Grundbegriff und neue Axiome anreichern müssten, um über geordnete Paare reden zu können.

Wir definieren nun für beliebige Klassen A, B:

A × B = { (a, b) | a  ∈  A, b  ∈  B }. (Kreuzprodukt zweier Klassen)

Bemerkung zur Notation

Die Schreibweise { (a, b) | a  ∈  A, b  ∈  B } ist eine suggestive Kurzform der üblichen Klassennotation { x | ∃a  ∈  A, b  ∈  B x = (a, b) }. Ähnliche Notationen verwenden wir in Zukunft ohne weiteren Kommentar.

Aus dem Begriff des geordneten Paares lässt sich nun der Relationsbegriff und weiter der Funktionsbegriff gewinnnen. Eine Klasse R heißt relationale Klasse oder kurz Relation, falls jedes Element von R ein geordnetes Paar ist. Mit anderen Worten: Es gilt R ⊆ V × V. Statt (a, b)  ∈  R schreiben wir auch a R b (Infix-Notation).

Für eine Relation R und eine Klasse C setzen wir:

dom(R)	= { a \| ∃b (a, b)  ∈  R } (Definitionsbereich, engl. „domain“)
rng(R)	= { b \| ∃a (a, b)  ∈  R } (Wertebereich, engl. „range“)
R″C	= { b \| ∃a  ∈  C (a, b)  ∈  R } (Bild von C unter R)
R^{− 1}	= { (b, a) \| (a, b)  ∈  R } (Umkehrrelation)

Eine Klasse F heißt eine funktionale Klasse oder kurz Funktion, falls F eine Relation und für alle (a, b), (a, c)  ∈  F gilt, dass b = c. Statt (a, b)  ∈  F schreiben wir auch F(a) = b und nennen b den Funktionswert von F an der Stelle a.

Funktionsangabe

Wir schreiben F : A → B, falls A = dom(F) und rng(F) ⊆ B.

Ist F : A → B, so heißt B ein Wertevorrat für F. (Ein Wertevorrat ist bei unserer Fassung des Funktionsbegriffs nicht eindeutig.)

Sind F : A → B und G : B → C, so sei

G ∘ F = { (a, G(F(a)) | a  ∈  A }

die Verknüpfung von F und G. Weiter sei

F|C = { (a, b)  ∈  F | a  ∈  C }

die Einschränkung von F auf eine Klasse C, und es sei Id_A = { (a, a) | a  ∈  A } die Identität auf A. Für a  ∈  V sei id_a = Id_a.

Eine Folge der Form 〈 x_a | a  ∈  A 〉 ist nichts anderes als die Funktion F : A → V mit F(a) = x_a für alle a  ∈  A.

Eine Funktion F heißt injektiv, falls aus F(a) = F(b) stets a = b folgt. Ist F injektiv, so ist F⁻¹ eine Funktion, die sog. Umkehrfunktion. Eine Funktion F : A → B heißt surjektiv (bzgl. B), falls rng(F) = B gilt, und bijektiv (bzgl. B), falls F injektiv und surjektiv ist.

Für beliebige Klassen A, B setzen wir:

^AB = { f | f : A → B }. (Klasse aller Funktionen von A nach B)

Der Begriff der funktionalen Klasse liefert eine elegante und suggestive Formulierung des Ersetzungsschemas. Wir können es nun notieren als:

Ersetzungsschema (Ers)

Sei F : V → V eine Funktion. Dann gilt F″a  ∈  V für jede Menge a.

Es gilt F″a = { F(b) | b  ∈  a }. In dieser Schreibweise wird die „Ersetzung“ besonders deutlich. Wir ersetzen jedes b in a durch F(b). Dabei ist F eine sprachlich gegebene Funktion. Ist f  ∈  V eine Funktion und a eine Menge, so lässt sich f ″a  ∈  V ohne Verwendung von (Ers) zeigen ((!), vgl. auch (iii) der Übung unten).

Der Projektionssatz über echte Klassen lässt sich nun so formulieren: Ist F injektiv und A eine echte Klasse, so ist jede Klasse B ⊇ F″A echt.

Einfache Folgerungen aus den Axiomen

Die Existenzaxiome von ZFC werden eingesetzt, um zu zeigen, dass wir den Bereich der Mengen durch einfache Operationen nicht verlassen. Beispiele sind:

Übung

Zeigen Sie, dass für alle Mengen a, b gilt:

(i)	⋂ a  ∈  V, falls a ≠ ∅, a ∪ b  ∈  V, a ∩ b  ∈  V

(ii)	a × b  ∈  V

(iii)

^ab  ∈  V

(iv)	dom(a)  ∈  V, rng(a)  ∈  V, falls a Relation

[ zu (i): Sei b  ∈  a beliebig. Dann gilt ⋂ a = { x  ∈  b | ∀c  ∈  a x  ∈  c }. Weiter ist a ∪ b = ⋃ { a, b }, a ∩ b = ⋂ { a, b }.

zu (ii) und (iii): Wir schreiben a × b = { p  ∈  c | φ(p) } und ^ab = { f  ∈  d | ψ(f) } für geeignete Mengen c und d und Eigenschaften φ und ψ. Aus (Aus) folgt dann die Behauptung. ]

Nach Definition ist ⋂ ∅ = V, sodass die Voraussetzung in (i) notwendig ist.

Mengenbeschränkung

Die Mengenbeschränkung wie im Beweis von a × b  ∈  V und ^ab  ∈  V wird häufig verwendet, um zu zeigen, dass eine Klasse A = { x | φ(x) } eine Menge ist. Mit Hilfe der Existenzaxiome (Pa), (Ver), (Pot), … finden wir eine hinreichend große Menge b, für die wir A ⊆ b zeigen können. Dann folgt A  ∈  V aus der Instanz des Aussonderungsschemas für die Formel „x  ∈  b ∧ φ(x)“.

Übung

Gleichwertig zum Ersetzungsschema über den restlichen Axiomen ist die Aussage:

„Sei F : V → V eine Funktion. Dann gilt F|a  ∈  V für alle a  ∈  V.“

Die Tragweite der Epsilon-Sprache

Wir erzeugen im Laufe der Entwicklung der axiomatisch begründeten Mengenlehre ein gewaltiges Gebäude von aufeinander aufbauenden Begriffen. Dabei verlassen wir die formale Epsilon-Sprache an keiner Stelle. Auch komplizierte Sachverhalte wie zum Beispiel die rekursive Definition entlang der natürlichen Zahlen und auch entlang der echten Klasse der Ordinalzahlen, die wir unten diskutieren werden, können wir axiomatisch rechtfertigen und die rekursiv definierten Objekte durch  ∈ -Formeln charakterisieren. Ausdrücke wie „n = m!“ oder auch „x = sin(1/3)“ sind letztendlich Formeln φ(n, m) und ψ(x) der Epsilon-Sprache. Die Rückführung kann, soweit es überhaupt von Interesse ist, den Maschinen überlassen bleiben. Wichtig ist nur, dass wir logisch untadelig vorgehen, denn nur so erhalten wir den angestrebten Grad an Genauigkeit und Sicherheit. Diese Korrektheit ist keineswegs beschwerlich. Wir folgen dem sympathischen Prinzip, neue Begriffe aus alten zu gewinnen, und das ist nichts, was der Mengenlehre eigen wäre. Im Gegensatz zu anderen mathematischen Gebieten müssen in der Mengenlehre aber auch die einfachsten Objekte wie die Zahlen und die einfachsten Begriffe wie die der Relation und der Funktion begründet und durch Mengen interpretiert werden.

Was erlaubt ist und was nicht, lernt man durch Beobachtung und Reflexion. In der Mengenlehre darf man viel, das Arbeiten ist frei. Nur einige wenige Dinge verlangen Vorsicht. Wir müssen z. B. immer beachten, dass Klassen keine Objekte der Theorie sind und nicht entsprechend verwendet werden dürfen. Doch auch hier bekommt man schnell einen Blick für das Mögliche und Erlaubte.

Beispiel

Wenn wir sagen: „Für alle x existiert ein y mit χ(x, y)“, so heißt das, dass wir die Aussage ∀x ∃y χ(x, y) der  ∈ -Sprache betrachten und beweisen wollen. Wenn wir dagegen sagen:

„Für jede Klasse A = { x | φ(x) } gibt es eine Klasse B = { y | ψ(y) } sodass gilt: Für alle x  ∈  A gibt es ein y  ∈  B mit χ(x, y).“,

so ist diese Behauptung nicht von der Form ∀A ∃B …, da die Quantoren ∀ und ∃ nur über Mengen laufen. Die Aussage ist vielmehr ein Theoremschema. Wir behaupten, dass wir zu einer gegebenen Formel φ(x) immer eine Formel ψ(y) finden können, sodass gilt:

(+) ∀x. φ(x) → ∃y. ψ(y) ∧ χ(x, y).

Wir müssen also erstens angeben, wie wir ψ(y) aus φ(x) konstruieren (effektiv auf dem Papier), und zweitens müssen wir ein Argument dafür geben, dass die  ∈ -Aussage (+) in ZFC beweisbar ist, egal, welche Formel φ(x) zu Beginn vorlag. Behauptungen über Klassen haben in ZFC notwendig einen konstruktiven Charakter.

Neben Relationen und Funktionen werden in der axiomatischen Mengenlehre auch die natürlichen, ganzen, rationalen und reellen Zahlen als Mengen eingeführt und nicht mehr als naiv gegebene Grundobjekte betrachtet. Wir geben im Folgenden eine Durchführung des Themas „Zahlen als Mengen“, beschränken uns dabei aber darauf, den Weg sichtbar zu machen, ohne ihn Schritt für Schritt zu gehen. Am interessantesten ist hier die Konstruktion der natürlichen Zahlen und weiter dann die Konstruktion der reellen Zahlen.

Die natürlichen Zahlen

Obwohl die natürlichen Zahlen ein Anfangsstück der Ordinalzahlen sein werden, ist es instruktiv, sie vorab zu definieren. Dieses Vorgehen beleuchtet die Axiome und ist ein Paradebeispiel für eine nichttriviale mengentheoretische Interpretation von mathematischen Objekten.

Definition (induktiv)

Eine Klasse A heißt induktiv, falls gilt :

(i)

∅  ∈  A.

(ii)	Für alle x  ∈  A ist auch x ∪ { x }  ∈  A.

Das Unendlichkeitsaxiom besagt dann also: Es existiert eine induktive Menge. Wir definieren:

Definition (natürliche Zahl, ω, ℕ)

Wir setzen:

ω = ℕ = ⋂ { x ⊆ x₀ | x ist induktiv },

wobei x₀ eine beliebige induktive Menge ist. Die Elemente von ω heißen natürliche Zahlen.

Es ist leicht zu sehen, dass diese Definition nicht von der speziellen Wahl der induktiven Grundmenge x₀ abhängt. Weiter ist ω selbst eine induktive Menge.

Beispiele

Einige Elemente von ω sind:

0 := ∅

1 := { 0 }

2 := 1 ∪ { 1 } = { 0, 1 },

3 := 2 ∪ { 2 } = { 0, 1, 2 }, …

17 := 16 ∪ { 16 } = { 0, 1, 2, …, 16 }, …

Hier sind 0, 1, 2, 3, … neue Konstanten, mit denen wir unsere Epsilon-Sprache erweitern, oder alternativ Abkürzungen für bestimmte Formeln. So ist zum Beispiel „x  ∈  2“ die Formel „x = 0 ∨ x = 1“, die wir als  ∈ -Formel ausschreiben können:

∀y y  ∉  x ∨ ∃y. y  ∈  x ↔ ∀z z  ∉  y.

Eine grundlegende Funktion auf den natürlichen Zahlen ist:

Definition (Nachfolgerfunktion S, n + 1)

Die Nachfolgerfunktion S : ω → ω ist definiert durch S(n) = n ∪ { n } für alle n  ∈  ω. Statt S(n) schreiben wir auch n + 1.

Jedes induktive x ⊆ ω ist nach der Schnittdefinition bereits identisch mit ω. Hieraus fließen die folgenden Induktionssätze:

Satz (Nachfolger-Induktion für ω)

Sei A eine Teilmenge von ω mit:

(a)

0  ∈  A.

(b)	Für alle n  ∈  A gilt n + 1  ∈  A.

Dann ist A = ω.

Beweis

A ist induktiv, also gilt A = ω.

Satz (starke Induktion für ω)

Sei A ⊆ ω. Für alle n  ∈  ω gelte:

n ⊆ A impliziert n  ∈  A.

Dann ist A = ω.

Beweis

Sei B = { n  ∈  A | n ⊆ A }. Dann ist B induktiv (!). Also ist ω = B ⊆ A.

Wir führen nun noch eine Ordnung auf ω ein. Hierzu definieren wir:

Definition (transitive Klassen)

Eine Klasse A heißt transitiv, falls für alle x  ∈  A gilt, dass x ⊆ A.

Eine transitive Klasse A „kennt“ also die Elemente aller ihrer Elemente. Steigen wir in A die  ∈ -Relation hinab, so sind alle Mengen, die wir dabei antreffen, Elemente von A. Ist z. B. d  ∈  c  ∈  b  ∈  a  ∈  A, so ist d  ∈  A. Der Transitivität werden wir noch häufig begegnen. Im Kontext von ω ist von Bedeutung:

Übung

(i)	Sei x induktiv. Dann ist { y  ∈  x \| y ⊆ x und y ist transitiv } induktiv.

(ii)	ω ist transitiv und jedes Element von ω ist transitiv.

Die Transitivität von ω und aller n  ∈  ω ermöglicht eine einfache Definition der Ordnung auf den natürlichen Zahlen:

Definition (die Ordnung < auf ω)

Wir definieren für n, m  ∈  ω: n < m, falls n  ∈  m.

Übung

(i)	Für alle n  ∈  ω ist n = { m  ∈  ω \| m < n } ⊆ ω.

(ii)	< ist transitiv und irreflexiv auf ω (ohne Verwendung von (Fun)).

(iii)

Für alle n  ∈  ω − { 0 } gibt es genau ein m  ∈  ω mit n = m + 1.

(iv)	Für alle n, m  ∈  ω mit n < m ist n + 1 ≤ m.

(v)	< ist eine lineare Ordnung auf ω.

(vi)	Ist x ⊆ ω transitiv, so ist x  ∈  ω oder x = ω.

Die starke Induktion ist damit also die Induktion entlang < mit Rückgriff auf sämtliche Vorgänger: „aus m  ∈  A für alle m < n folgt n  ∈  A“. Wir erhalten:

Satz (< ist eine Wohlordnung)

Die lineare Ordnung < ist eine Wohlordnung auf ω: Jedes nichtleere A ⊆ ω besitzt ein <-kleinstes Element.

Beweis

Sei B = ω − A. Annahme, A hat kein kleinstes Element. Für alle n  ∈  ω gilt dann:

n ⊆ B impliziert n  ∈  B.

Also ist B = ω und damit A = ∅, Widerspruch.

Die natürlichen Zahlen ohne Unendlichkeitsaxiom

Wir können die natürlichen Zahlen auch ohne Verwendung des Unendlichkeitsaxioms als Klasse definieren, und das Unendlichkeitsaxiom dann einsetzen, um zu zeigen, dass diese Klasse eine Menge ist.

Definition (die Formel nat(x) und die Klasse Ω)

nat(x) sei die Formel:

„x ist transitiv, durch  ∈  wohlgeordnet, und jedes nichtleere y ⊆ x besitzt ein  ∈ -maximales Element“.

Wir setzen Ω = { x | nat(x) }.

In der Sprechweise des nächsten Kapitels besagt nat(x): „x ist eine von Neumann-Zermelo-Ordinalzahl und kleiner als die erste Limesordinalzahl.“ In der Tat ist die allgemeine Ordinalzahldefinition die Motivation für diese Formel.

Eine gleichwertige symmetrische Formulierung von nat(x) lautet: „x ist transitiv, durch  ∈  linear geordnet, und jede nichtleere Teilmenge von x besitzt sowohl ein  ∈ -minimales als auch ein  ∈ -maximales Element“.

Die Aussage „Ω  ∈  V“ ist über einem schwachen Fragment von ZFC − (Un) gleichwertig zum Unendlichkeitsaxiom, und weiter ist Ω dann identisch mit der Menge ω:

Satz (über die Klasse Ω)

(a)	In der Theorie Z − (Un) + „Ω ist eine Menge“ gilt das Unendlichkeitsaxiom.

(b)	In Z gilt Ω = ω, und damit ist insbesondere Ω eine Menge.

Beweis

zu (a):

Ω ist eine induktive Klasse, also gilt (Un), falls Ω eine Menge ist.

zu (b):

Wir arbeiten in Z. Obige Ergebnisse über ω sind in Z beweisbar.

Es gilt ω ⊆ Ω, da nat(n) für alle n  ∈  ω gilt. Sei umgekehrt x eine Menge mit nat(x). Wir zeigen, dass x  ∈  ω. Wir setzen hierzu:

n = x ∩ ω.

Dann ist n transitiv. Also gilt n  ∈  ω oder n = ω. Der Fall n = ω ist unmöglich, da sonst n ⊆ x kein  ∈ -maximales Element besitzen würde. Also ist n  ∈  ω.

Wir zeigen, dass x = n gilt. Andernfalls ist x − n ⊆ x nichtleer.

Sei also m das  ∈ -kleinste Element von x − n. Dann ist jedes k  ∈  m ein Element von n, d. h. es gilt m ⊆ n. Umgekehrt ist auch jedes k  ∈  n ein Element von m, da nach Linearität der  ∈ -Ordnung auf x sonst m  ∈  k oder m = k und damit m  ∈  n gelten würde. Insgesamt ist also n = m.

Dann ist aber n = m  ∈  x, also n  ∈  x ∩ ω = n, Widerspruch.

Rekursion auf ω

Wir rechtfertigen nun rekursive Definitionen entlang der natürlichen Zahlen: Bei der Definition einer Funktion F : ω → V dürfen wir zur Definition von F(n) auf alle „bereits definierten“ Funktionswerte F(m) mit m < n zurückgreifen.

Satz (Rekursionssatz für ω)

Sei G : V → V eine funktionale Klasse. Dann existiert eine eindeutige funktionale Klasse F : ω → V mit :

(+) F(n) = G(F|n) für alle n  ∈  ω.

Der Satz ist ein Spezialfall des allgemeinen Rekursionssatzes für Ordinalzahlen, den wir im nächsten Kapitel kennen lernen werden.

Beweis

Wir nennen eine Funktion f eine n-Approximation (der Rekursion gemäß G), falls gilt:

(i)	dom(f) = n, n  ∈  ω,

(ii)	für alle m < n ist f (m) = G(f\|m).

Eine Induktion nach n  ∈  ω zeigt:

(++) Es existiert genau eine n-Approximation.

Denn ∅ ist die eindeutige 0-Approximation, und ist f die eindeutige n-Approximation, so ist f ∪ { (n, G(f)) } die eindeutige (n + 1)-Approximation. Wir können also setzen:

F(n) = G(„die eindeutige n-Approximation“) für alle n  ∈  ω.

Dann gilt die Rekursionsgleichung (+), wie eine Induktion nach n  ∈  ω zeigt. Ist F′ eine weitere Funktion, die (+) erfüllt, so zeigt eine erneute Induktion, dass F(n) = F′(n) für alle n  ∈  ω gilt. Also ist F = F′.

Der Beweis des Rekursionssatzes lässt sich in der Theorie Z durchführen. (Dass für jede Funktion F : ω → V und jedes n  ∈  ω die Einschränkung F|n eine Menge ist, zeigt man durch Induktion nach n.) Das Ersetzungsschema wird aber gebraucht, um zu zeigen, dass die konstruierte Funktion F : ω → V eine Menge ist.

Beispiel

Wir diskutieren den Rekursionssatz und die Rolle des Ersetzungsschemas an einem Beispiel. Wir betrachten die informal präsentierte Rekursion:

F(0) = ω, F(n + 1) = ℘(F(n)) für alle n  ∈  ω.

F(n) ist also das Resultat der n-maligen Anwendung der Potenzmengenoperation auf ω. Wir schreiben auch ℘ⁿ(ω) anstelle von F(n). Dann ist also

F = { (n, F(n)) | n  ∈  ω } = 〈 ℘ⁿ(ω) | n  ∈  ω 〉.

In ZFC − (Ers) kann man nicht zeigen, dass die Klasse F eine Menge ist. Dies wird aus den Modellkonstruktionen des zweiten Abschnitts folgen.

Die informale Angabe der Rekursion können wir leicht in die allgemeine Form „F(n) = G(F|n)“ des Rekursionssatzes bringen. Wir definieren hierzu eine funktionale Klasse G : V → V durch

$G (x) = { \begin{matrix} ω, & falls x = 0 \\ ℘ (x (n)), & falls x ist eine Funktion auf n + 1 \in ω \\ \emptyset, & sonst. \end{matrix}$

Der Rekursionssatz liefert uns eine funktionale Klasse F mit F(n) = G(F|n) für alle n  ∈  ω. Offenbar gilt dann wie gewünscht F(0) = ω und F(n + 1) = ℘(F(n)) für alle n  ∈  ω. Die Funktion G ist also die „offizielle“ Grundlage der Rekursion. Informal präsentierte Rekursionen sind aber oft viel besser lesbar, und auf die explizite Angabe von G kann in der Regel verzichtet werden.

Funktionale Klassen sind durch Formeln definiert, und der Beweis des Rekursionssatzes zeigt, wie wir eine F definierende Formel aus einer G definierenden Formel konstruieren können. Für unser Beispiel lässt sich die folgende Formel φ(n, x) in zwei Variablen n und x und dem Parameter ω zur Definition von F = 〈 ℘ⁿ(ω) | n  ∈  ω 〉 verwenden:

φ(n, x) = „n  ∈  ω	∧ ∃g. g ist Funktion auf n + 1 = { 0, …, n }
	∧ g(0) = ω
	∧ (∀m < n g(m + 1) = ℘(g(m)))
	∧ x = g(n)“.

Die Formel φ(n, x) besagt, dass die Menge x aus ω durch n-malige Anwendung der Potenzmengenoperation entsteht. Es gilt

F = { (n, x) | φ(n, x) }.

Die Ausdrücke „x = ℘ⁿ(ω)“ und „y  ∈  ℘ⁿ(ω)“ können wir also frei verwenden, als Abkürzungen der Formeln φ(x, n) bzw. ∃x. φ(x, n) ∧ y  ∈  x der Epsilon-Sprache. Analoge Überlegungen gelten für alle anderen Rekursionen.

Wir betrachten noch „beschränkte“ Rekursionen. Ist die Klasse

F = { (n, x) | φ(n, x) }

das Ergebnis der Rekursion mit G, und können wir in der Theorie ZFC − (Ers) eine Menge M finden, sodass für alle n  ∈  ω die Menge F(n) ein Element von M ist, so ist

F = { (n, x)  ∈  ω × M | φ(n, x) }

eine Menge nach dem Aussonderungsschema. Das Ersetzungsschema muss also in diesem Fall zur „Ver-Mengung“ von F nicht herangezogen werden.

Beispiele für beschränkte Rekursionen liefert die Einführung der Arithmetik auf den natürlichen Zahlen. Hier können wir einfach M = ω wählen.

Definition (rekursive Arithmetik auf ω)

Wir definieren jeweils rekursiv für alle n  ∈  ω durch Rekursion über m  ∈  ω:

(i)	n + 0 = n, n + (m + 1) = (n + m) + 1

(ii)	n · 0 = 0, n · (m + 1) = (n · m) + n

(iii)

n⁰ = 1, n^m + 1 = n^m · n

Der Leser möge zur Übung den rekursiv definierten Ausdruck „k = n · m“ in eine  ∈ -Formel φ(k, n, m) auflösen.

Dedekind-Strukturen

Wir wollen nun noch die gewonnene Struktur ω der natürlichen Zahlen charakterisieren. Hierzu definieren wir:

Definition (Dedekind-Struktur)

Seien x eine Menge, f : x → x eine Funktion, und sei e  ∈  x.

Dann heißt 〈 x, f, e 〉 eine Dedekind-Struktur (oder auch Peano-Struktur), falls gilt:

(D1)	e  ∉  rng(f).
(D2)	f ist injektiv.
(D3)	Für alle y ⊆ x gilt: Ist e  ∈  y und f ″y ⊆ y, so ist y = x.

f heißt die Nachfolgerfunktion und e das Anfangselement der Struktur.

Eine Dedekind-Struktur beschreibt das Zählen als

e, f (e), f (f (e)), f (f (f (e))), …

Ob das Anfangselement e dabei die Rolle der Null oder die der Eins übernimmt, wird erst durch die Einführung der Addition auf der Dedekind-Struktur festgelegt. Zunächst geht es uns nur um den Zählvorgang selbst, der irgendwo anfängt und der durch die schrittweise Nachfolgerbildung dominiert wird. Der Zählvorgang erreicht nie seinen Ausgangspunkt (D1) und weiter wird der Nachfolger f (a) einer Zahl a nur über die Zahl a erreicht (D2). Unsere Vorstellung ist weiter, dass wir jede Stelle des Zählvorgangs erreichen, wenn wir die Nachfolgerfunktion wiederholt auf das Anfangselement anwenden. Der mengentheoretische Rahmen, der zur Formalisierung dieser scheinbar einfachen Vorstellung benötigt wird, ist beachtlich, denn (D3) ist eine Aussage über alle Teilmengen von x.

Übung

Sei 〈 x, f, e 〉 eine Dedekind-Struktur. Zeigen Sie:

(i) rng(f) = x − { e }, (ii) f (a) ≠ a für alle a  ∈  x.

〈 ω, S, 0 〉 ist eine Dedekind-Struktur. Mit Hilfe des Rekursionssatzes können wir relativ leicht zeigen, dass 〈 ω, S, 0 〉 bis auf Isomorphie die einzige Dedekind-Struktur ist:

Satz (Isomorphiesatz für Dedekind-Strukturen)

Sei 〈 x, f, e 〉 eine Dedekind-Struktur. Dann ist 〈 ω, S, 0 〉 isomorph zu 〈 x, f, e 〉, d.h. es gibt ein bijektives i : ω → x mit den Eigenschaften:

i(0) = e und i(S(n)) = f (i(n)) für alle n  ∈  ω .

Beweis

Wir definieren i : ω → x rekursiv durch:

i(0) = e, i(S(n)) = f (i(n)) für alle n  ∈  ω.

Es ist nur noch zeigen, dass die Funktion i : ω → x bijektiv ist. Sei hierzu y = rng(i). Dann ist e  ∈  y und f ″y ⊆ y, also ist y = x nach (D3). Also ist i : ω → x surjektiv. Es bleibt also zu zeigen:

(+) i : ω → x ist injektiv.

Beweis von (+)

Annahme nicht. Dann existiert

n = min({ k  ∈  ω | es gibt ein m ≠ k mit i(k) = i(m) }).

Sei m  ∈  ω, m ≠ n, mit i(n) = i(m). Dann gilt n < m. Insbesondere ist m ≠ 0 und folglich gibt es ein m′ mit m = S(m′). Es gilt

i(n) = i(m) = i(S(m′)) = f (i(m′)) ≠ e

nach (D1), also ist n ≠ 0. Sei also n = S(n′). Dann gilt

f (i(n′)) = i(S(n′)) = i(n) = f (i(m′)).

Also gilt i(n′) = i(m′) nach (D2), im Widerspruch zu n′ ≠ m′, n′ < n und der minimalen Wahl von n.

Der Satz bedeutet nicht, dass es nur eine absolut gültige Interpretation der Eigenschaften (D1) − (D3) geben kann: Unter schwachen Voraussetzungen lässt sich ein Modell von ZFC konstruieren, dessen − innerhalb des Modells bis auf Isomorphie eindeutig bestimmte − Dedekind-Struktur nicht isomorph zu 〈 ω, S, 0 〉 ist.

Die ganzen, rationalen und reellen Zahlen

Aus den natürlichen Zahlen lassen sich nun schrittweise der Ring der ganzen Zahlen ℤ, der Körper der rationalen Zahlen ℚ, und schließlich der Körper der reellen Zahlen ℝ konstruieren. Damit sind dann die wichtigsten Grundobjekte der Mathematik als Mengen axiomatisch eingeführt.

Wir setzen zunächst:

ℤ = ω²/∼,

wobei die Äquivalenzrelation ∼ definiert ist durch:

(n, m) ∼ (n′, m′), falls n + m′ = n′ + m für alle n, m, n′, m′  ∈  ω.

Wir schreiben suggestiv und ungefährlich auch n − m anstelle von (n, m)/∼, und weiter n anstelle von n − 0 sowie − n anstelle von 0 − n. Damit gilt also für alle n  ∈  ω:

n	= n − 0 = (n, 0)/∼ = { (n, 0), (n + 1, 1), (n + 2, 2), … },
− n	= 0 − n = (0, n)/∼ = { (0, n), (1, n + 1), (2, n + 2), … }.

Die geordneten Paare der Form (n, 0) und (0, n) sind hier die kanonischen Repräsentanten der Äquivalenzklassen, und wir können damit die Menge ℤ der ganzen Zahlen mit der Menge { (n, 0), (0, n) | n  ∈  ω } identifizieren, wenn wir möchten.

Wir definieren nun eine Addition, Multiplikation und Ordnung auf ℤ durch:

(n − m) + (n′ − m′) = (n + n′) − (m + m′),

(n − m) · (n′ − m′) = (n · n′ + m · m′) − (m · n′ + n · m′),

n − m < n′ − m′, falls n + m′ < n′ + m,

wobei auf der rechten Seite die Addition, Multiplikation und Ordnung auf ω verwendet wird. All dies ist wohldefiniert, und 〈 ℤ, +, · 〉 erweist sich als ein kommutativer Ring mit Einselement. Die Relation < ist eine lineare Ordnung auf ℤ, die die Addition respektiert, d. h. ist a < b in ℤ, so ist a + c < b + c für alle c  ∈  ℤ.

Der Schritt von ℕ nach ℤ liefert Inverse für die Addition: Für alle a gibt es nun ein b mit a + b = 0. Um Inverse für die Multiplikation zu erhalten, müssen wir ℤ erweitern, denn für ein a in ℤ gibt es nur dann ein b in ℤ mit a · b = 1, falls a = 1 oder a = − 1 gilt. Die additiv neutrale Null spielt bei der Inversenbildung für die Multiplikation eine Sonderrolle, die man anhand des Distributivgesetzes einsehen kann. Wäre, in irgendeiner Erweiterung von ℤ, a multiplikativ invers zu 0, so müsste a · 0 = 1 gelten. Wollen wir, dass das Distributivgesetz gilt, so hätten wir also

1 = a · 0 = a (0 + 0) = a · 0 + a · 0 = 1 + 1

und damit 0 = 1. Die Null müssen wir also als Ausnahme zulassen.

Die Erweiterung von ℤ um multiplikative Inverse führt zum Körper ℚ der rationalen Zahlen. Wir setzen:

ℚ = (ℤ × (ℤ − { 0 }))/∼,

wobei nun die Äquivalenzrelation ∼ definiert ist durch

(a, b) ∼ (c, d), falls a · d = c · b für alle a, b, c, d  ∈  ℤ.

Wir schreiben auch a/b anstelle von (a, b)/∼, und führen eine wohldefinierte Addition, Multiplikation und Ordnung auf ℚ ein durch

a/b + c/d = (a · d + c · b) / (b · d), a/b · c/d = (a · c) / (b · d),

a/b < c/d, falls a · b · d² < c · d · b²,

wobei auf der rechten Seite die Addition, Multiplikation und Ordnung auf ℤ verwendet werden. Dann ist, wie man mit etwas Mühe nachrechnet, die Struktur 〈 ℚ, +, ·, < 〉 ein angeordneter Körper. Dabei wird ein Körper 〈 K, +, · 〉 durch eine lineare Ordnung < auf K zu einem angeordneten Körper, falls für alle x, y, z  ∈  K gilt:

(a)	x < y impliziert x + z < y + z,

(b)	x, y > 0 impliziert x · y > 0.

Die Ordnung 〈 ℚ, < 〉 erweist sich nun allerdings als unvollständig, d. h. es gibt nach oben beschränkte Teilmengen der Ordnung, die kein Supremum in der Ordnung besitzen. Ein Beispiel ist die Menge { q  ∈  ℚ | q² < 2 } (Irrationalität der Quadratwurzel aus 2). Das fehlende Supremum und Infimum führt dazu, dass die Funktion g : ℚ → ℚ mit g(q) = q² − 2 für alle q  ∈  ℚ keine Nullstellen in ℚ besitzt, obwohl sie stetig ist und positive und negative Werte annimmt.

Um den Mangel der Unvollständigkeit zu beheben, muss der angeordnete Körper der rationalen Zahlen dramatisch vergrößert werden. Die beiden klassischen Methoden hierzu stammen von Cantor und Dedekind.

Bei der Methode von Cantor betrachten wir Cauchyfolgen oder Fundamentalfolgen in ℚ, d. h. Folgen f : ω → ℚ derart, dass für alle positiven ε in ℚ ein n₀  ∈  ω existiert, sodass für alle n, m ≥ n₀ gilt, dass |f (m) − f (n)| < ε. (Dabei ist für alle rationalen Zahlen q der Betrag |q| von q gleich q, falls q ≥ 0, und gleich − q sonst.) Weiter heißt eine Folge h : ω → ℚ eine Nullfolge, falls für alle positiven ε in ℚ ein n₀  ∈  ω existiert, sodass für alle n ≥ n₀ gilt, dass |h(n)| < ε. Wir setzen nun:

ℝ = { f/∼ | f : ω → ℚ ist eine Cauchyfolge },

wobei die Äquivalenzrelation ∼ auf den Cauchyfolgen in ℚ definiert ist durch

f ∼ g, falls 〈 f (n) − g(n) | n  ∈  ω 〉 ist eine Nullfolge.

Intuitiv sind f und g äquivalent, wenn sie „im Limes übereinstimmen“, „auf denselben Punkt x des Kontinuums zulaufen“, „denselben Grenzwert x haben“. Der Punkt oder die Zahl x wird zur Definition von f ∼ g aber nicht benötigt, und daher können wir x formal als die Menge der zu f und g äquivalenten Folgen definieren. Der Leser sieht einmal mehr: Wir interpretieren. Wie wir geordnete Paare als bestimmte verschachtelte Mengen, Funktionen als bestimmte Mengen von geordneten Paaren, natürliche Zahlen als bestimmte aus der leeren Menge aufgebaute Mengengebilde, negative Zahlen als bestimmte Äquivalenzklassen von natürlichen Zahlen interpretiert haben, so definieren wir nun reelle Zahlen als bestimmte Äquivalenzklassen von Cauchyfolgen. Wir füllen die Lücken von ℚ formal einwandfrei mit Folgen, die auf diese Lücken zeigen.

Die Addition und Multiplikation wird nun „punktweise“ eingeführt, z. B. wird + auf ℝ definiert durch f/∼ + g/∼ = h/∼, wobei h(n) = f (n) + g(n) für alle n  ∈  ω. Die reelle Ordnung wird etabliert durch:

f/∼ < g/∼, falls es gibt ein n₀  ∈  ω derart, dass f (n) < g(n) für alle n ≥ n₀.

Dann ist 〈 ℝ, +, ·, < 〉 ein angeordneter Körper und 〈 ℝ, < 〉 ist vollständig.

Bei der äquivalenten Methode nach Dedekind steht die Ordnung im Vordergrund, und das „Füllen der Lücken mit Hilfe der Lücken“ wird hier besonders klar. Ein (Dedekind-) Schnitt in ℚ ist ein Paar (L, R) nichtleerer Mengen derart, dass L und R eine disjunkte Zerlegung von ℚ bilden, in der jedes Element von L kleiner ist als jedes Element von R ; zudem verlangen wir, dass das Supremum von L im Falle der Existenz ein Element von L ist. Wir setzen nun:

ℝ = { (L, R) | (L, R) ist ein Schnitt in 〈 ℚ, < 〉 }, und definieren

(L₁, R₁) < (L₂, R₂), falls L₁ ⊂ L₂ für alle (L₁, R₁), (L₂, R₂)  ∈  ℝ.

Dies liefert eine vollständige Ordnung 〈 ℝ, < 〉. Die Arithmetik kann wieder, mit einiger Mühe im Detail, von ℚ nach ℝ geliftet werden.

Letztendlich ist jede Methode geeignet, die einen vollständigen angeordneten Körper 〈 K, +, ·, < 〉 liefert, d. h. einen angeordneten Körper, für den 〈 K, < 〉 eine vollständige lineare Ordnung ist. Gleichwertig zur Vollständigkeit von 〈 K, < 〉 ist die Konjunktion der beiden Aussagen:

(a)	Jede Cauchy-Folge konvergiert. (metrische Vollständigkeit)

(b)	Für alle 0 < x < y in K gibt es ein n  ∈  ω mit nx ≥ y. (archimedisches Axiom)

Es gilt der folgende Satz, für dessen ausführlicheren Beweis wir den Leser auf die Literatur verweisen:

Satz (Isomorphiesatz für das klassische Kontinuum)

Je zwei vollständig angeordnete Körper sind isomorph.

Beweisskizze

Wir dürfen annehmen, dass jeder angeordnete Körper K den Körper ℚ umfasst. Denn zunächst identifizieren wir 0  ∈  ω mit 0  ∈  K, 1  ∈  ω mit 1  ∈  K, 2  ∈  ω mit 1 + 1  ∈  K, 3  ∈  ω mit 1 + 1 + 1  ∈  K, usw. Dann können wir die Menge aller ± n/m  ∈  K, n, m  ∈  ω, m ≠ 0 mit ℚ identifizieren. Ist weiter K archimedisch geordnet, so ist ℚ dicht in K, d. h. für alle x < y in K gibt es ein q  ∈  ℚ mit x < q < y.

Seien also K₁, K₂ vollständig angeordnete Körper. Dann ist ℚ jeweils dicht, und wir können den gesuchten Isomorphismus f : K₁ → K₂ definieren durch

f (x) = „das K₂-Supremum von { q  ∈  ℚ | q < x in K₁ }“ für alle x  ∈  K₁.

Trotz dieses Charakterisierungssatzes kommt den verschiedenen Konstruktionsmöglichkeiten von ℝ ein methodisches Gewicht zu. Jede von ihnen beleuchtet auf ihre Weise die neben ω wichtigste Grundstruktur der Mathematik.

Aus axiomatischer Sicht ruht die Konstruktion von ℝ, wie auch immer sie vollzogen wird, ganz wesentlich auf der Potenzmenge der natürlichen Zahlen. Diese Abhängigkeit führt, wie wir im zweiten Abschnitt sehen werden, dazu, dass das klassische Kontinuum in verschiedenen Modellen von ZFC unterschiedlich interpretiert werden kann.

Mathematik im Rahmen von ZFC

Bereits an dieser Stelle sollte deutlich geworden sein, dass und wie die Mathematik als Mengenlehre aufgefasst werden kann. Wir können Zahlen, Funktionen und Relationen und alle zugehörigen mathematischen Operationen mengentheoretisch interpretieren. Die Axiome erlauben uns großzügig die Bildung neuer Strukturen, etwa die Bildung von Produkt- und Funktionenräumen wie ℝ × ℝ und ^ℝℝ. Schon lange vor der Mengenlehre wurden geometrische Gebilde algebraisch interpretiert, und damit haben auch sie ein Abbild im Mengenuniversum. Die Mengenlehre ist damit nicht nur eine mathematische Theorie mit eigenen Fragen und einer eigenen Dynamik, sondern sie beleuchtet und präzisiert auch die Grundlagen der Mathematik. Ein weiter Weg führt von Cantors Untersuchung von „Linearen Punktmannigfaltigkeiten“ (Teilmengen von ℝ) zum heutigen flexiblen iterativen Mengenbegriff, der „Mengen von Mengen“, „Mengen von Mengen von Mengen“ usw. bildet und nutzt, um mathematisches Denken als  ∈ -Struktur abzubilden, etwa in der Definition von (a, b) als { { a }, { a, b } }, von 0 als ∅, 1 als { 0 }, 2 als { 0, 1 }, …, n als { 0, …, n − 1 }. Keine griechischen Säulen, sondern sachliche Stahlkonstruktionen mit großer Tragkraft.

Zur Verwendung des Auswahlaxioms

In einer naiven Umgebung treten Auswahlakte häufig in funktionalen Definitionen der Form

f (i) = „ein x mit den folgenden Eigenschaften: …“ für alle i  ∈  I

auf. ln der axiomatischen Theorie wird zur Rechtfertigung dieser Definitionen das Auswahlaxiom eingesetzt, und wir wollen hier kurz diesen typischen Einsatz von (AC) sowie einige elementare äquivalente Fassungen diskutieren. Später werden wir das Auswahlaxiom in einem eigenen Kapitel noch genauer untersuchen.

Satz (Umformulierungen des Auswahlaxioms)

Die folgenden Aussagen sind äquivalent über ZF:

(i)

(AC).

(ii)	Sei M eine Menge mit ∅  ∉  M. Dann existiert eine Auswahlfunktion für M, d. h. ein f : M → ⋃ M mit f (x)  ∈  x für alle x  ∈  M.

(iii)

Sei I eine Menge und sei 〈 M_i | i  ∈  I 〉 eine Folge nichtleerer Mengen.

Dann ist ⨉_{i  ∈  I} M_i ≠ ∅, wobei

⨉_{i  ∈  I} M_i = { f | dom(f) = I, f (i)  ∈  M_i für alle i  ∈  I }.

Beweis

(i) ↷ (iii):

Sei M = { { i } × M_i | i  ∈  I }. Dann erfüllt M die Voraussetzungen von (AC). Eine Auswahlmenge für M gemäß (AC) ist ein Element von ⨉_{i  ∈  I} M_i, denn sie hat die Form { (i, x_i) | i  ∈  I } mit x_i  ∈  M_i für alle i  ∈  I.

(iii) ↷ (ii):

Wir wenden (iii) an auf die Folge 〈 x | x  ∈  M 〉. Jedes f  ∈  ⨉_{x  ∈  M} x ist dann eine Funktion von M nach ⋃ M mit f (x)  ∈  x für alle x  ∈  M.

(ii) ↷ (i):

Sei M eine Menge paarweise disjunkter nichtleerer Mengen. Sei f : M → ⋃ M wie in (ii). Dann ist rng(f) eine Auswahlmenge für M.

Definitionen der Form „ein …“ können wir damit axiomatisch wie folgt rechtfertigen. Gegeben seien eine „Vorratsmenge“ M und eine „Indexmenge“ I. (Ist lediglich eine Folge 〈 N_i | i  ∈  I 〉 gegeben, so setzen wir M = ⋃_{i  ∈  I} N_i.) Wir definieren nun eine Funktion f auf I informal durch:

(+) f (i) = „ein x  ∈  M mit φ(x, i)“ für alle i  ∈  I,

wobei die Formel φ(x, i) auch Parameter enthalten kann. Diese Definition können wir formal rechtfertigen, wenn es für alle i  ∈  I ein x  ∈  M gibt mit φ(x, i). Denn sei:

M_i = { x  ∈  M | φ(x, i) } für alle i  ∈  I.

Nach Voraussetzung sind alle Mengen M_i nichtleer, und damit existiert nach (iii) des Satzes ein f  ∈  ⨉_{i  ∈  I} M_i. Die informale Definition (+) ist damit letztendlich nur eine suggestive und lesbare Form von: „Sei f  ∈  ⨉_{i  ∈  I} M_i.“

Übung

Obige Argumentation verwendet die Folge 〈 M_i | i  ∈  I 〉.

Zeigen Sie ohne Verwendung von (Ers), dass diese Folge existiert.

Übung

Die folgenden Aussagen sind äquivalent zu (AC) in ZF:

(i)	Jede Äquivalenzrelation auf einer Menge besitzt ein vollständiges Repräsentantensystem.

(ii)	Für alle surjektiven Mengen M N und alle g : M → N gibt es ein h : N → M mit g ∘ h = id_N.

(iii)

Für alle Mengen A, B, C, alle f : A → C und alle surjektiven g : B → C existiert ein h : A → B mit f = g ∘ h.

(iv)	Sei M eine Menge, und sei R ⊆ M² derart, dass es für alle x  ∈  M ein y  ∈  M gibt mit x R y. Dann existiert ein f : M → M, sodass x R f (x) für alle x  ∈  M gilt.

Elementare Mächtigkeitstheorie

Den Anfang der Mächtigkeitstheorie bilden die folgenden Cantorschen Definitionen:

Definition (relationale Definition der Mächtigkeiten)

Für alle Mengen M, N setzen wir:

\|M\| ≤ \|N\|,	falls ein injektives f : M → N existiert,
\|M\| = \|N\|,	falls ein bijektives f : M → N existiert,
\|M\| < \|N\|,	falls \|M\| ≤ \|N\| und \|M\| ≠ \|N\|.

Gilt |M| ≤ |N|, so sagen wir, dass die Mächtigkeit von M kleinergleich der Mächtigkeit von N ist. Analoge Sprechweisen gelten für |M| = |N| und |M| < |N|. Ein Objekt |M|  ∈  V, die Mächtigkeit von M, haben wir dabei noch nicht definiert.

Die drei Mächtigkeitsrelationen sind Klassenrelationen auf dem Universum. Man sieht leicht ein, dass ≤ reflexiv und transitiv ist, dass = eine Äquivalenzrelation ist, und dass < irreflexiv ist. Die erste Hürde, die bei der Untersuchung der drei Mächtigkeitsrelationen auftaucht, ist die Antisymmetrie von ≤ bzgl. der Gleichmächtigkeit oder gleichwertig (!) die Transitivität von <. Diese Hürde wird durch den Satz von Cantor-Bernstein übersprungen. Wir geben zwei Beweise und zeigen dabei auch eine Klassenversion des Satzes.

Satz (Satz von Cantor-Bernstein)

Seien M, N Mengen derart, dass |M| ≤ |N| und |N| ≤ |M|. Dann gilt |M| = |N|.

Beweis

Es genügt, die folgende Inklusionsform zu beweisen:

(+)	Seien A, B, C paarweise disjunkt mit \|A ∪ B ∪ C\| = \|A\|. Dann gilt \|A ∪ B ∪ C\| = \|A ∪ B\|.

Beweis hierzu: Seien g₁ : M → N und g₂ : N → M injektiv. Seien

A = rng(g₂ ∘ g₁), B = rng(g₂) − A, C = M − rng(g₂).

Dann ist M = A ∪ B ∪ C und |M| = |A|. Ist h : A ∪ B ∪ C → A ∪ B bijektiv, so ist g₂^{− 1} ∘ h : M → N bijektiv.

Beweis von (+): Sei f : A ∪ B ∪ C → A bijektiv. Wir setzen:

Z = ⋂ { D ⊆ A ∪ C | C ⊆ D, f ″D ⊆ D }.

Dann gilt C ⊆ Z, f ″Z ⊆ Z, und genauer f ″Z = Z − C. Also ist f|Z : Z → Z − C bijektiv, und damit ist h = f|Z ∪ id_{A ∪ B − Z} eine Bijektion von A ∪ B ∪ C nach A ∪ B.

Wir zeigen nun noch stärker:

Satz (Klassenversion des Satzes von Cantor-Bernstein)

(a)	Seien A, B, C paarweise disjunkte Klassen, und sei F : A ∪ B ∪ C → A bijektiv. Dann gibt es ein bijektives H : A ∪ B ∪ C → A ∪ B.

(b)	Seien K, L Klassen, und seien G₁ : K → L und G₂ : L → K injektiv. Dann gibt es ein bijektives G : K → L.

Obigen Beweis können wir nicht direkt übernehmen: Der Schnitt über alle Teilklassen D ⊆ A ∪ C ist nicht durchführbar, da wir über Klassen nicht quantifizieren dürfen.

Beweis

Wie für Mengen genügt es, die Aussage (a) zu zeigen. Wir setzen:

C* = { x  ∈  A ∪ C \|	es gibt eine Folge 〈 x₀, …, x_n 〉 mit:
	x₀  ∈  C, x_i + 1 = F(x_i) für alle i < n, x_n = x }.

Dann gilt F″C* = C* − C (!) und H = F|C* ∪ Id_{A ∪ B − C*} ist wie gewünscht.

Dieser Beweis verwendet die natürlichen Zahlen, greift aber nicht auf das Unendlichkeitsaxiom zurück. Denn „n ist eine natürliche Zahl“ und „es gibt eine Folge 〈 x₁, …, x_n 〉“ lässt sich ohne Verwendung von ω in der  ∈ -Sprache ausdrücken (siehe die Formel nat(x) oben). Zum Beweis des Satzes genügen elementare Axiome, die die Existenz von ∅ und x ∪ { y } für alle Mengen x und y sichern. Wir kommen im Kapitel über endliche Mengenlehre darauf zurück.

Beide Beweise konstruieren dieselbe Funktion:

Übung

Für Mengen A, B, C gilt C* = Z, wobei die Menge Z wie im ersten Beweis und die Menge C* wie im zweiten Beweis definiert ist.

Eine Anwendung der Klassenversion des Satzes von Cantor-Bernstein ist:

Übung

Es gibt ein bijektives F : V → V × V.

[ Id_{V × V} : V × V → V und H : V → V × V mit H(x) = (x, ∅) sind injektiv. ]

Aufgrund des konstruktiven Charakters von Sätzen über Klassen lässt sich aus dem zweiten Beweis eine Formel gewinnen, die ein bijektives F : V × V → V mit Hilfe der beiden Injektionen Id_{V × V} und H definiert. Es ist eine gute Übung herauszufinden, wie die Funktion F in diesem Fall aussieht.

Zahlreiche weitere Beispiele lassen sich angeben: Ist A eine Klasse und existiert ein injektives G : V → A, so liefert die Klassenversion des Satzes von Cantor-Bernstein eine Bijektion F : V → A, denn für alle Klassen A ist die Identität auf A eine Injektion von A nach V.

Endlichkeit

Wir betrachten die folgenden natürlichen Ansätze, den Begriff der Endlichkeit zu fassen:

Definition (endlich, Dedekind-endlich, Tarski-endlich)

Eine Menge x heißt:

(a)	endlich, falls ein n  ∈  ω existiert mit \|n\| = \|x\|,

(b)	Dedekind-endlich, falls kein y ⊂ x existiert mit \|y\| = \|x\|,

(c)	Tarski-endlich, falls jedes nichtleere A ⊆ ℘(x) ein ⊆-maximales Element besitzt.

Die Formen (b) und (c) machen keinen Gebrauch von ω. Wir zeigen in Z:

Satz (Äquivalenz von Endlichkeit und Tarski-Endlichkeit)

Für alle x sind äquivalent:

(i)	x ist endlich.

(ii)	x ist Tarski-endlich.

Beweis

(i) ↷ (ii):

Durch Induktion nach n  ∈  ω zeigt man: n ist Tarski-endlich.

(ii) ↷ (i):

Sei A = { y ⊆ x | es gibt ein n  ∈  ω mit |y| = |n| }. Nach Voraussetzung existiert ein maximales z  ∈  A. Dann ist aber z = x (!). Nach Definition von A gibt es also ein n  ∈  ω mit |x| = |n|.

Eine natürliche Variante der Tarski-Endlichkeit ist der folgende auf Russell zurückgehende Begriff:

Definition (Russell-endlich)

Eine Menge x heißt Russell-endlich, falls für jedes dynamische A ⊆ ℘(x) gilt, dass x  ∈  A. Dabei heißt A ⊆ ℘(x) dynamisch, falls ∅ ein Element von A ist und zudem die folgende Bedingung erfüllt ist:

Für alle y  ∈  A mit y ≠ x gibt es ein a  ∈  x − y mit y ∪ { a }  ∈  A.

In der Axiomatik Z lässt sich die Äquivalenz dieser Variante zur Tarski-Endlichkeit zeigen:

Übung

Für alle x sind (mit einem Beweis in Z) äquivalent:

(i)	x ist Tarski-endlich.

(ii)	x ist Russell-endlich.

[ (i) ↷ (ii): Sei A ⊆ ℘(x) dynamisch, und sei z maximal in A. Dann ist z = x.

(ii) ↷ (i): Sei A ⊆ ℘(x) nichtleer. Sei B = { z | es gibt ein y  ∈  A mit z ⊆ y }.

Annahme, A hat kein maximales Element. Dann ist B dynamisch. Also gilt x  ∈  B und damit x  ∈  A nach Definition von B, Widerspruch. ]

Die Dedekind-Unendlichkeit von M ist in Z äquivalent zu |ω| ≤ |M|, und sie ist in ZC äquivalent zur Unendlichkeit von M.

Übung

Beweisen Sie diese Aussagen. Für welche Implikation wird das Auswahlaxiom verwendet?

Für die Implikation „Dedekind-endlich impliziert endlich“ wird das Auswahlaxiom gebraucht. Wir werden im zweiten Abschnitt mit der Erzwingungsmethode ein Modell von ZF konstruieren, in dem eine Dedekind-endliche Menge existiert, die nicht endlich ist.

Wir notieren noch einen Induktionssatz für die Klasse der endlichen Mengen.

Definition (die Klasse Fin)

Wir setzen Fin = { x | x ist endlich }.

Es gilt nun:

Satz (Induktionssatz für die endlichen Mengen)

Sei E eine Teilklasse von Fin mit:

(i)

∅  ∈  E.

(ii)	Für alle x  ∈  E und alle y  ∈  V ist x ∪ { y }  ∈  E.

Dann gilt E = Fin.

Beweis

Sei x  ∈  Fin, und sei

A = { y ⊆ x | y  ∈  E }.

Nach Voraussetzung (i) ist A nichtleer. Wegen x Tarski-endlich gibt es ein ⊆-maximales z  ∈  A. Nach Voraussetzung (ii) ist dann aber offenbar z = x. Also gilt x  ∈  E.

Abzählbarkeit und Überabzählbarkeit

An Mächtigkeitsbegriffen führen wir weiter ein:

Definition (abzählbar, überabzählbar)

Eine Menge M heißt:

(i)	abzählbar, falls \|M\| ≤ \|ω\|

(ii)	abzählbar unendlich, falls \|M\| = \|ω\|

(iii)

überabzählbar, falls M nicht abzählbar

Viele Mengen sind abzählbar, z. B. ω², ω³, …, ωⁿ, … Abzählbar ist auch noch die Menge

Seq = ⋃_{n  ∈  ω} ⁿω = { s | s ist eine endliche Folge von natürlichen Zahlen }.

Denn für s  ∈  Seq sei g(s) = 2^s(0) · 3^n₁ · … · p_k^s(k − 1), wobei p_i die i-te Primzahl und k = |s| die Länge von s ist. Dann ist g : M → ω injektiv, also |M| ≤ |ω|. Der Satz von Cantor-Bernstein liefert wegen |ω| ≤ |M| ein bijektives h : ω → M.

Der folgende fundamentale Satz zeigt dagegen den Reichtum der Mächtigkeitstheorie:

Satz (Satz von Cantor)

Für alle Mengen M ist |M| < |℘(M)|.

Beweis

Sei f eine Funktion auf M. Dann ist

D = { x  ∈  M | x  ∉  f (x) }  ∈  ℘(M)

kein Element von rng(f), denn wäre D = f (y) für ein y  ∈  M, so gilt

y  ∈  D gdw y  ∉  f (y) gdw y  ∉  D,

Widerspruch.

Das Argument ist nicht nur für die Mächtigkeitstheorie bedeutsam:

Zusammenhang mit der Russell-Zermelo-Antinomie

Durchdenken wir das Argument des Satzes von Cantor mit dem Universum V statt M und der Identität Id_V auf V, so gelangen wir zur Erkenntnis, dass

D = { x  ∈  V | x  ∉  Id_V(x) } = { x | x  ∉  x } = R

nicht im Wertebereich von Id_V liegt, d. h. es gilt R  ∉  rng(Id_V) = V. Die Russell-Zermelo-Antinomie erscheint damit als logische Quintessenz des „diagonalen Beweises“ des Satzes von Cantor über die Mächtigkeit der Potenzmenge.

Aus der Konstruktion von ℝ gewinnen wir (mit Hilfe des Satzes von Cantor-Bernstein) ohne größere Schwierigkeiten:

(#) |ℝ| = |℘(ℕ)|.

Im Licht dieser Gleichmächtigkeit ist eine reelle Zahl eine Teilmenge der natürlichen Zahlen (und umgekehrt). Der Satz von Cantor liefert:

Korollar (Überabzählbarkeit von ℝ)

ℝ ist überabzählbar.

Alternativ kann man das Argument des Beweises des Satzes von Cantor direkt auf ℝ anwenden, indem man in der bekannten Weise die Nachkommastellen einer abzählbaren Folge von reellen Zahlen in Dezimaldarstellung diagonalisiert.

Wegen der Wichtigkeit des Ergebnisses geben wir zwei weitere Beweise.

Beweis (Überabzählbarkeit von ℝ via Vollständigkeit)

Sei g = 〈 x_n | n  ∈  ℕ 〉 eine Folge reeller Zahlen. Wir definieren rekursiv:

a₀	= x₀,
a₁	= „das erste Glied von g größer als a₀“,
a_n + 2	= „das erste Glied von g, das zwischen a_n und a_n + 1 liegt“ für alle n  ∈  ω.

Ist a_n nicht definiert für ein n  ∈  ω, so ist rng(g) offenbar ungleich ℝ.

Andernfalls ist das nichtleere reelle Intervall [ sup_{n  ∈  ω} a_2n, inf_{n  ∈  ω} a_2n + 1 ] disjunkt mit rng(f). Also ist g auch in diesem Fall nicht surjektiv.

Der folgende Beweis benutzt die Cantorsche Charakterisierung des Ordnungstyps der rationalen Zahlen: Jede abzählbare, dichte und unbeschränkte lineare Ordnung 〈 M, < 〉 ist ordnungsisomorph zu 〈 ℚ, < 〉.

Beweis (Ordnungstheoretischer Beweis der Überabzählbarkeit von ℝ)

Die Ordnung Q = ℚ − { 0 } hat die Lücke (L, R) mit L = { q  ∈  ℚ | q < 0 } und R = { q  ∈  ℚ | q > 0 }. Folglich ist ℝ überabzählbar, denn sonst wären die Ordnungen Q und ℝ isomorph (da abzählbar, dicht, unbeschränkt), und 〈 ℝ, < 〉 hätte dann wie 〈 Q, < 〉 Lücken. 〈 ℝ, < 〉 ist aber nach Konstruktion vollständig.

Schließlich folgt die Überabzählbarkeit von ℝ auch sofort aus dem Baireschen Kategoriensatz:

Definition (nirgendsdicht, mager)

(a)	Ein N ⊆ ℝ heißt nirgendsdicht, wenn für alle c < d in ℝ Elemente c′ < d′ in ℝ existieren mit c < c′ < d′ < d und N ∩ ] c′, d′ [ = ∅.

(b)	Ein M ⊆ ℝ heißt mager, falls M eine abzählbare Vereinigung nirgendsdichter Mengen ist.

Für alle x  ∈  ℝ ist { x } nirgendsdicht, und damit ist jede abzählbare Menge reeller Zahlen mager. Die Überabzählbarkeit von ℝ folgt damit sofort aus folgendem Satz:

Satz (Bairescher Kategoriensatz für die reellen Zahlen)

Seien a < b reelle Zahlen. Dann ist das reelle Intervall ] a, b [ nicht mager.

Beweis

Sei 〈 N_n | n  ∈  ω 〉 eine Folge nirgendsdichter Teilmengen von ] a, b [.

Wir können leicht rekursiv eine ⊆-absteigende Folge 〈 I_n | n  ∈  ω 〉 von abgeschlossenen nichtleeren Intervallen definieren mit

I_n ∩ N_n = ∅ für alle n  ∈  ω.

Dann ist jedes x  ∈  ⋂_{n  ∈  ω} I_n ≠ ∅ ein Element von ] a, b [ − ⋃_{n  ∈  ω} N_n.

Wir werden die Theorie der Mächtigkeiten erst wieder aufgreifen, wenn wir die Ordinalzahlen − das „Rückgrat der Mengenlehre“ − zur Verfügung haben.

{ x  ∈  A \| x  ∈  B }	als { x \| x  ∈  A ∧ x  ∈  B } (Klassenaussonderung)
{ a₁, …, a_n }	als { x \| x = a₁ ∨ … ∨ x = a_n } (Angabe der Elemente)
{ }	als { x \| x ≠ x } (leere Klasse)

Die Axiome von ZFC

Extensionalitätsaxiom (Ext)

Existenz der leeren Menge (LM)

Paarmengenaxiom (Pa)

Vereinigungsmengenaxiom (Ver)

Potenzmengenaxiom (Pot)

Aussonderungsschema (Aus)

Ersetzungsschema (Ers))

Unendlichkeitsaxiom (Un)

Fundierungsaxiom (Fun)

Auswahlaxiom (AC für „Axiom of Choice“)

Überblick über die Rolle der Axiome

Mengen und Klassen

Definition (Klassen)

Beispiele für beweisbare Klassenaussagen

Mengen als Klassen

Satz (Mengen als Klassen)

Beweis

Klassen als Mengen

Definition (Klassen als Mengen)

Definition (Allklasse, Universum, V)

Satz (Klassen als Mengen)

Beweis

„Element von V“-Formulierungen der Existenzaxiome von ZF

Komprehensionsschema (Kom)

Echte Klassen

Definition (echte Klasse)

Definition (Russell-Zermelo-Klasse, R)

Satz (über die Klasse R)

Beweis

Übung

Satz (Projektionssatz)

Beweis

Elementare Interpretationen

Bemerkung zur Notation

Funktionsangabe

Ersetzungsschema (Ers)

Einfache Folgerungen aus den Axiomen

Übung

Mengenbeschränkung

Übung

Die Tragweite der Epsilon-Sprache

Beispiel

Die natürlichen Zahlen

Definition (induktiv)

Definition (natürliche Zahl, ω, ℕ)

Beispiele

Definition (Nachfolgerfunktion S, n + 1)

Satz (Nachfolger-Induktion für ω)

Beweis

Satz (starke Induktion für ω)

Beweis

Definition (transitive Klassen)

Übung

Definition (die Ordnung < auf ω)

Übung

Satz (< ist eine Wohlordnung)

Beweis

Die natürlichen Zahlen ohne Unendlichkeitsaxiom

Definition (die Formel nat﻿(x) und die Klasse Ω)

Satz (über die Klasse Ω)

Beweis

Rekursion auf ω

Satz (Rekursionssatz für ω)

Beweis

Beispiel

Definition (rekursive Arithmetik auf ω)

Dedekind-Strukturen

Definition (Dedekind-Struktur)

Übung

Satz (Isomorphiesatz für Dedekind-Strukturen)

Beweis

Die ganzen, rationalen und reellen Zahlen

Satz (Isomorphiesatz für das klassische Kontinuum)

Beweisskizze

Mathematik im Rahmen von ZFC

Zur Verwendung des Auswahlaxioms

Satz (Umformulierungen des Auswahlaxioms)

Beweis

Übung

Definition (die Formel nat(x) und die Klasse Ω)