Lexikon: Statistische_Signifikanz

 

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z   Alle

In der Statistik heißen Unterschiede signifikant (Bedeutsamkeit|bedeutsam), wenn sie mit einer bestimmten Wahrscheinlichkeit nicht durch Zufall zustande gekommen sind. Die Überprüfung der statistischen Signifikanz geschieht mit Hilfe einer Nullhypothese, die verworfen wird, wenn das zufällige Zustandekommen des Unterschiedes sehr unwahrscheinlich ist. Der Grad der zu überprüfenden Unwahrscheinlichkeit wird vorher festgelegt und mit \alpha bezeichnet, beispielsweise \alpha=0{,}05 für 5% Irrtumswahrscheinlichkeit.

Die statistische Signifikanz beschreibt also den Informationsgehalt eines Ereignisses bzw. einer Messung.

Beispiele

  • Bei einer politischen Umfrage wird festgestellt, dass 55% der Frauen zu Partei A tendieren, während von 53% der Männer Partei B bevorzugt wird. Gibt es tatsächlich einen Unterschied bei der politischen Überzeugung von Männern und Frauen oder sind nur zufällig bei den Frauen viele Anhängerinnen von Partei A und bei den Männern von Partei B befragt worden? (Teste Nullhypothese|H0)
  • Mit einem neuen Medikament ist die Heilungsrate höher als ohne Medikament. Ist das neue Medikament wirklich wirksam oder sind nur zufällig besonders viele Patienten ausgewählt worden, die auch von alleine wieder gesund geworden wären? (Teste H1 (Statistik)|H1)
  • In der Umgebung einer Chemiefabrik tritt eine bestimmte Krankheit besonders häufig auf. Ist das Zufall oder gibt es einen Zusammenhang?

In den oben genannten Beispielen kann man sich nie hundertprozentig sicher sein, dass der Zufall die Ergebnisse nicht verfälscht hat. Man kann aber berechnen, wie wahrscheinlich es ist, dass die gemessenen Ergebnisse nur aufgrund eines ungünstigen Zufalls auftreten. Dieser zufällige Fehler wird allgemein als Fehler 1. Art und bei Signifikanzen als Irrtumswahrscheinlichkeit bezeichnet.

Es hat sich eingebürgert, ohne dass es dafür einen besonderen mathematischen oder sonstigen Grund gäbe, die Irrtumswahrscheinlichkeit auf 5 Prozent festzulegen. Das bedeutet aber in der Praxis, dass eine von 20 Untersuchungen, die sich auf diese Berechnung verlässt, zu falschen Schlüssen kommt.

Auch bei vorgeblich statistisch signifikanten Aussagen ist immer eine kritische Überprüfung der Versuchsanordnung und -durchführung notwendig. Nur selten genügen wissenschaftliche Untersuchungen den mathematischen Anforderungen an einen aussagefähigen Statistische Tests|statistischen Test. Bei vielen Studien steht der Wunsch des oder der Studiendurchführenden (z.B. im Rahmen einer Doktorarbeit) nach einem 'signifikanten' Ergebnis bei der Studiendurchführung zu sehr im Vordergrund - Untersuchungen, bei denen die Nullhypothese bestätigt wird, werden nämlich gemeinhin als uninteressant und überflüssig angesehen. Als Hinweise auf die Qualität einer Studie können im medizinischen Umfeld die Eigenschaften "Randomisierung|randomisiert", "kontrolliert" und "doppelblind" gelten. Ohne diese sind Aussagen etwa zur Wirksamkeit von Therapien mit äußerster Vorsicht zu behandeln. Sehr schwierig und problematisch ist insbesondere die Interpretation signifikanter Korrelationen in retrospektive Studie|retrospektiven Studien. Zu bedenken ist darüberhinaus stets, dass aus statistisch signifikanten Korrelation|Korrelationen oft fälschlich auf eine vermeintliche Kausalität geschlossen wird (Beispiel: Zwischen 1960 und 1990 korrelierte die Zahl der Störche in Deutschland signifikant mit der Geburtenrate, da beide Zahlen stark gesunken sind, dennoch ist die Kausalität zumindest fraglich).

Aussagewert und Power (Beispiel klinische Forschung)

Statistisch signifikante Studien können trotzdem einen geringen praktischen Aussagewert haben.

Studien mit großer Fallzahl führen aufgund der hohen statistischen Power oft zu hoch signifikanten Ergebnissen. Solche Studien können trotzdem einen geringen Aussagewert haben, wenn die Größe des beobachteten Effekts (oder der gemessene Parameter) nicht klinische Relevanz|klinisch relevant ist. Statistische Signifikanz ist also ein notwendiges Kriterium, aber noch kein hinreichender Beweis für Wirkung eines Medikaments von praktischer Relevanz.

Weitere kritische Prüfsteine vom methodologischen Gesichtspunkt aus sind:

- die Korrektheit der statistischen Modellannahmen (beispielsweise die Wahrscheinlichkeitsverteilung|Verteilungsannahme)

- die Anzahl der durchgeführten statistischen Tests (bei mehreren Tests, von welchen nicht einer eindeutig als primärer Test gekennzeichnet ist, sollte eine Adjustierung des Signifikanzniveaus durchgeführt werden)

- die prospektive Definition der Analysemethoden vor der "Entblindung" doppelblinder Studien.

Irrige Überzeugungen

Entgegen weit verbreiteter Meinung ist Signifikanz mit der Irrtumswahrscheinlichkeit gleich zu setzen (Beck-Bornholdt und Dubben). Nicht zutreffend sind die Annahmen, das Signifikanzniveau (bzw. der beobachtete P-Wert) lege fest

  • die Effektgröße
  • die Wahrscheinlichkeit, dass die Nullhypothese wahr oder falsch ist
  • die Wahrscheinlichkeit, dass die Alternativhypothese wahr oder falsch ist
  • den Grad der Zuversicht, dass das Ergebnis wiederholbar ist

(Quelle: Gerd Gigerenzer, Zeno Swijtink, Theodore Porter: Das Reich des Zufalls ISBN 3827401011)

Wissenschaftliches Publizieren

Vielfach wurde die Signifikanz als Maß dafür genommen, ob ein wissenschaftlicher Artikel veröffentlicht werden sollte. Dies führt jedoch zum sogenannten "Publikationsbias", da mögliche Zufallsergebnisse nicht durch Publikation der gesamten Bandbreite der durchgeführten Untersuchungen relativiert werden können.

Die Herausgeber der Zeitschrift für Sozialpsychologie erklärten hingegen ausdrücklich, dass die Annahme von Artikeln in ihrer Zeitschrift nicht von der Signifikanz der Ergebnisse abhängt, da die Redaktion einen Kontrapunkt zu dem Ausbreiten des Fehler 1. Art|Fehlers 1. Art schaffen wolle. In der Publikation von Ergebnissen Studie (Medizin)|klinischer Studien sind derzeit Anstrengungen durch internationale Fachzeitschriften wie auch der forschenden Institutionen (insbesondere Pharmaunternehmen) im Gange, öffentlich zugängliche Datenbanken, in welchen verbindlich alle durchgeführten Studien sowie ihre prospektiv definierten Zielparameter enthalten sind, zu schaffen. Dadurch sollen die Komplettheit der Veröffentlichung auch unangenehmer Resultate überprüfbar und eine Einschätzung des Publikationsbias möglich werden.

Literatur

  • Hans-Peter Beck-Bornholdt, Hans-Hermann Dubben: Der Hund, der Eier legt, (Rowolt 2001), ISBN 3499611546, (populärwissenschaftliche Darstellung)

Siehe auch

  • Operationscharakteristik, , Wahrscheinlichkeitsverteilung, T-Test, F-Test, Informationsqualität


Kategorie:Statistik

en:Statistical significance nl:Significantie pt:Significância estatística