next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Binomialverteilung   Index


Normalverteilung

Die Normalverteilung (engl.: normal distribution) ist ein Verteilungsmodell für »kontinuierliche Zufallsvariablen«. Sie wurde ursprünglich von Carl Friedrich Gauß (1777-1855) zur Beschreibung von Meßfehlern entwickelt: die sogenannte Gaußsche Fehlerkurve. Die Normalverteilung unterstellt eine symmetrische Verteilungsform in Form einer Glocke, bei der sich die Werte der Zufallsvariablen in der Mitte der Verteilung konzentrieren und mit größerem Abstand zur Mitte immer seltener auftreten. Die Normalverteilung ist das wichtigste Verteilungsmodell der Statistik und wird für unterschiedlichste Zwecke verwendet: u.a. als deskriptives Modell zur Beschreibung empirischer Variablen, als Stichprobenverteilung des arithmetischen Mittels oder als Näherungslösung für viele andere Verteilungsmodelle.

Beispiele: Wenn man einen Intelligenztest an einer repräsentativen Stichprobe normiert, unterstellt man häufig eine Normalverteilung der Testpunkte, die die Untersuchungspersonen bei dem Test erzielen. Die Testrohwerte werden für jede Altersgruppe so transformiert, daß sich ein durchschnittlicher Punktwert von 100 und eine Standardabweichung von 15 ergibt. Nach dieser Normierung kann der Test für diagnostische Zwecke verwendet werden. Wenn beispielsweise eine Person, deren Intelligenz diagnostiziert werden soll, insgesamt 113 Testpunkte erzielt, betrachtet man die Wahrscheinlichkeit, ein solches Testergebnis zu erreichen, um zu beurteilen, wie überdurchschnittlich intelligent die Person ist. In dem Beispiel geht es also um die Wahrscheinlichkeit, maximal einen Punktwert von $ X=113$ zu erreichen, wenn die Verteilung aller Punktwerte einer Normalverteilung folgt, durchschnittlich einen Wert von $ \mu =100$ Punkten aufweist und die Varianz aller Punktwerte $ \sigma ^{2}=15^{2}=2$25 beträgt.

Zusammengefaßt ist die »Dichtefunktion« $ f_{N}(x\vert\mu ,\sigma ^{2})$ der Normalverteilung von zwei Parametern $ \mu $ und $ \sigma ^{2}$ abhängig, die das Zentrum und die Streuung der Verteilung (den Aufsetzpunkt und die Weite der Glocke) steuern. Sie entsprechen dem »Erwartungswert« und der »Varianz« der normalverteilten Zufallsvariablen $ X$. Der Definitionsbereich von $ X$ ist im Prinzip unbegrenzt: $ -\infty \leq x \leq +\infty$.

Durch geeignete Wahl der Parameter $ \mu $ und $ \sigma ^{2}$ kann man die Normalverteilung auf durchschnittlich große oder kleine bzw. auf stark oder wenig streuende Zufallsvariablen anwenden. Die Normalverteilung mit den Parametern $ \mu =0$ und $ \sigma ^{2}=1$ bezeichnet man als Standardnormalverteilung. Ihre »Verteilungsfunktion« liegt in »tabellierter Form« vor. Standardnormalverteilte Zufallsvariablen werden auch mit $ Z$ abgekürzt, und die Standardnormalverteilung wird dementsprechend auch als $ Z$-Verteilung bezeichnet. Jede andere Normalverteilung mit Parametern $ \mu \neq 0$ und $ \sigma ^{2} \neq 1$ kann jedoch durch eine »$ z$-Transformation« in eine Standardnormalverteilung überführt werden. Für alle Normalverteilungen gelten folgende charakteristische Wertebereiche:

Darüber hinaus ist die Normalverteilung, wie erwähnt, eine Näherungslösung für viele andere Verteilungsmodelle. Da die »Binomialverteilung« ein häufig verwendetes Modell für diskrete Zufallsvariablen mit zwei Ausprägungen ist (im folgenden $ a$ und $ b$ genannt), ist die Approximation der Binomialverteilung von besonderer Bedeutung. Eine solche Näherung ist möglich, wenn der »Stichprobenumfang« $ n$ hinreichend groß und in der Grundgesamtheit der Anteil $ \theta$ der untersuchten Ausprägung $ a$ nicht zu klein ist. Als Faustregel verwendet man folgende Ungleichung: $ n \cdot \theta \cdot (1-\theta) \geq 9$. Da es sich bei der Binomialverteilung um ein Modell für diskrete Zufallsvariablen handelt, ist bei der Approximation durch eine Verteilung für kontinuierliche Zufallsvariablen strenggenommen auch eine Stetigkeitskorrektur vorzunehmen. Bei großen Stichprobenumfängen kann diese Korrektur jedoch vernachlässigt werden.

Für Konfidenzintervalle und statistische Tests ist eine »Tabelle« der inversen »Verteilungsfunktion« der Standardnormalverteilung hilfreich. $ Z(1-\alpha )$ zeigt für ausgewählte Wahrscheinlichkeiten $ 1-\alpha $ die entsprechenden Quantile der Standardnormalverteilung.

Beispiele: Man möchte wissen, in welchem Bereich die unteren 95% aller $ z$-Werte liegen. Aus der Tabelle entnimmt man für $ 1-\alpha =0,95$ das 95%-Quantil 1,645. Die unteren 95% aller $ z$-Werte liegen also im Bereich von $ -\infty$ bis einschließlich 1,645. Anders ausgedrückt: 5% aller $ z$-Werte sind größer als 1,645.

Notation: $ f_{N}(x\vert\mu ,\sigma ^{2})$ bezeichnet die Dichtefunktion der Normalverteilung, $ Z(1-\alpha )$ die inverse Verteilungsfunktion der Standardnormalverteilung.


next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Binomialverteilung   Index
HJA 2001-10-01