next up previous index
Nächste Seite: Pearsons Aufwärts: Tabellenanalyse Vorherige Seite: Prozentsatzdifferenz   Index


Kreuzproduktverhältnis (Odds Ratio)

Das Kreuzproduktverhältnis (engl.: cross product ratio) ist ein »Assoziationsmaß« für zwei »kategoriale Variablen«. Ausgangspunkt ist eine »Kreuztabelle« der beiden Variablen. Man vergleicht die bedingten Verteilungen der »Zielvariablen« $ Y$ für jeweils zwei verschiedene »Ausprägungen« der »unabhängigen Variablen« $ X$ und berechnet das Verhältnis der konditionalen »Odds« der Ausprägungen von $ Y$. Hat man, wie empfohlen, die Zielvariable in den Zeilen der Kreuztabelle abgetragen, dann berechnet sich das Kreuzproduktverhältnis aus den Spalten-Odds.

Beispiele: Im Wintersemester 1975/76 gab es im früheren Bundesgebiet 1,33 mal mehr Studierende in einem sozialwissenschaftlichen als in einem naturwissenschaftlichen Fach (konditionale Odds für das WS 75/76). Im Wintersemester 1991/92 waren es 1,74 mal so viele (konditionale Odds für das WS 91/92).[*] Anders ausgedrückt: Das Größenverhältnis von Studierenden der Sozial- zu Studierende der Naturwissenschaften hat um den Faktor 1,31 zugenommen (Kreuzproduktverhältnis).

Die Bezeichnung Kreuzproduktverhältnis leitet sich aus der Tatsache ab, daß sich das Berechnungsergebnis auch als Quotient kreuzweise miteinander multiplizierter Häufigkeiten der Tabelle darstellen läßt. Entscheidend für das Verständnis dieses Konzeptes ist jedoch, daß das Kreuzproduktverhältnis ein Quotient (Verhältnis) zweier konditionaler Odds ist. Daher auch die englische Bezeichnung Odds Ratio. Kreuzproduktverhältnisse fungieren in der Epidemiologie im Rahmen sogenannter Fall-Kontroll-Studien als Schätzer für das relative Risiko, d.h. für das Krankheitsrisiko der Untersuchungsgruppe relativ zu dem Risiko der Kontrollgruppe (mit dem Risiko ist jeweils das Größenverhältnis der Anzahl der Erkrankten zur Anzahl der Gesunden gemeint, also die konditionalen Odds). In vielen statistischen Programmpaketen findet man daher das Kreuzproduktverhältnis unter der Bezeichnung relatives Risiko. Einige Autoren verwenden auch die Bezeichnung Risiko- oder Chancenverhältnis. Ähnlich wie bei den Odds ist es also schwierig, eine passende deutsche Bezeichnung zu finden, die sich in unterschiedlichen sozialwissenschaftlichen Anwendungen verwenden läßt. Die Bezeichnung Kreuzproduktverhältnis, ein aus drei Substantiven zusammengesetztes Wort, klingt auch nicht sehr schön. Da es hier nur um die Definition eines (statistischen) Fachausdruckes geht, von dem man ohnehin erwartet, daß er nicht Teil der Alltagssprache ist, wird vorgeschlagen, den englischen Begriff Odds Ratio zu verwenden.

Hat die Zielvariable insgesamt $ r$ Ausprägungen ($ Y$ sollte in den Zeilen stehen, engl.: rows), dann kann man genau $ (r-1)$ voneinander unabhängige konditionale Odds und dementsprechend $ (r-1)$ voneinander unabhängige Odds Ratios berechnen, das $ r$-te Odds Ratio ergibt sich aus den bereits berechneten. Bei $ r\times c$-Tabellen müssen daher mehrere Odds Ratios gleichzeitig betrachtet werden. Man geht am besten so vor, daß man bei der Berechnung der konditionalen Odds unter inhaltlichen Gesichtspunkten eine der $ r$ Ausprägungen als Referenzkategorie auswählt und die Häufigkeiten der $ (r-1)$ anderen Ausprägungen im Verhältnis zur Häufigkeit dieser Ausprägung betrachtet. Bei $ 2\times 2$-Tabellen vereinfacht sich die Situation, weil hier nur ein Odds Ratio betrachtet werden muß.

Ähnliches gilt für die unabhängige Variable: Hat sie nicht zwei, sondern allgemein $ c$ Ausprägungen ($ X$ sollte in den Spalten stehen, engl.: columns), dann kann man genau ($ c-1$) bedingte Verteilungen miteinander vergleichen. Eine der insgesamt $ c$ Ausprägungen sollte man als Referenzkategorie auswählen, relativ zu der alle ($ c-1$) verbleibenden Ausprägungen betrachtet werden.

Das Odds Ratio ist nicht definiert, wenn eine der beiden konditionalen Odds aufgrund einer Häufigkeit von 0 nicht berechnet werden kann (ebenfalls nicht definiert ist). Ansonsten verläuft der Wertebereich von 0 bis $ +\infty$, wobei der Wert $ 1$ besagt, daß sich die konditionalen Odds der entsprechenden Ausprägungen von $ Y$ unter den verschiedenen Bedingungen nicht unterscheiden. Im Fall einer $ 2\times 2$-Tabelle, in der nur ein Odds Ratio berechnet werden muß, ist das gleichbedeutend mit der Aussage, daß beide Variablen $ X$ und $ Y$ statistisch nicht miteinander zusammenhängen. In größeren Tabellen, in denen mehrere Odds Ratios berechnet werden können, bedeutet der Wert 0 eine $ \dq$lokale$ \dq$ Unabhängigkeit. Werte nahe 0 oder nahe $ +\infty$ weisen in einer $ 2\times 2$-Tabelle auf einen (fast) perfekten Zusammenhang der beiden Variablen hin.

Handelt es sich um Variablen mindestens ordinalen »Meßniveaus«, möchte man auch die Richtung des Zusammenhangs interpretieren. Dabei weisen Werte kleiner als 1 auf einen negativen und Werte über 1 auf einen positiven Zusammenhang hin. Die Größe negativer und positiver Effekte ist jedoch schwer anhand des Odds Ratios zu vergleichen, da der Wertebereich negativer Effekte (0 bis unter 1) sehr viel kleiner ist als der Wertebereich positiver Effekte (größer 1 bis $ +\infty$). Ein Vergleich der Größe der Effekte (der Stärke des Zusammenhangs) ist jedoch möglich, indem man den Kehrwert des negativen Effektes betrachtet.

Beispiele: Das Odds Ratio zweier Variablen $ X$ und $ Y$ betrage $ OR=1,1$, was auf einen positiven Zusammenhang hindeutet. Der statistische Zusammenhang von $ Z$ und $ Y$ sei dagegen negativ, und zwar betrage das Odds Ratio $ OR=0,9$. Da der Kehrwert von $ 0,9$ der Zahl $ 1,11$ entspricht und damit größer als 1,1 ist, geht man davon aus, daß der Zusammenhang zwischen $ Z$ und $ Y$ stärker als der Zusammenhang zwischen $ X$ und $ Y$ ist.

Alternativ kann man das von George Udney Yule (1871-1951) vorgeschlagene Assoziationsmaß $ Q$ (Yules $ Q$) verwenden, das sich als eine Transformation des Odds Ratios darstellen läßt ( $ Q = (OR - 1) / (OR + 1)$) und das Odds Ratio auf das Intervall zwischen $ -1$ und $ +1$ normiert, mit dem Wert $ Q=0$, wenn beide Variablen statistisch voneinander unabhängig sind.

Notation: $ OR$.


next up previous index
Nächste Seite: Pearsons Aufwärts: Tabellenanalyse Vorherige Seite: Prozentsatzdifferenz   Index
HJA 2001-10-01