In den frühen 1990er Jahren entwickelte eine Gruppe von Klinikern und klinischen Epidemiologen um den mittlerweile in den freiwilligen Ruhestand getretenen Dave Sackett in Großbritannien und Kanada das Konzept der evidenzbasierten Medizin (EBM). Ziel war es, die besten verfügbaren wissenschaftlichen Daten für den behandelnden Arzt am Krankenbett verwendbar und interpretierbar zu machen.

EBM wurde definiert als:

„Das bewusste und verständige Nutzen der gegenwärtigen besten Beweise aus der Forschung, um Entscheidungen über die medizinische Versorgung (von einzelnen Personen) zu treffen. EBM zu praktizieren bedeutet, die individuelle klinische Erfahrung mit den besten verfügbaren externen Beweisen zu verbinden“ [11].

EBM sollte mehr als Gedanke, denn als Dogma begriffen werden [1]. Sie ruht auf 3 Säulen:

  • „attitudes“: Einstellung

  • „skills“: Werkzeuge

  • „knowledge“: Wissen

Als „attitude“ bezeichnen wir die Haltung, die wir in die Medizin einbringen. Diese beinhaltet nicht nur die innere Einstellung des Arztes dem Patienten gegenüber, sondern insbesondere den Respekt vor der Meinung und dem Wissen anderer Kollegen. EBM versucht, eine Atmosphäre der Offenheit und Achtung zu schaffen, die für die Lösung eines klinischen Problems notwendig sind.

Die „skills“ sind die Werkzeuge und Mittel, die uns helfen, externe Evidenz zu finden, zu interpretieren und für unsere Patienten gewinnbringend anzuwenden.

Die dritte Säule ist das „knowledge“ oder Fachwissen und wird auch als „interne Evidenz“ bezeichnet. Jeder Arzt kann sich je nach Ausbildungsstand und Erfahrung auf ein spezifisches Fachwissen berufen, das er sich im Lauf der Zeit angeeignet hat [11, 13].

EBM und Unfallchirurgie

Betrachtet man die oben genannte ursprüngliche Definition der EBM, findet man keine ernst zu nehmenden Gründe, warum EBM und Unfallchirurgie keine tragfähige Symbiose eingehen sollten [13]. Wir müssen uns jedoch eingestehen, dass insbesondere in den operativen Fächern eine latente Aversion gegen EBM besteht und deren Umsetzung in ihren eigentlichen Sinn, nämlich als innovativer Weg der Verbesserung individueller Krankenversorgung durch die Synthese der besten verfügbaren externen Evidenz (d. h. der Ergebnisse klinischer Forschung) und der ärztlichen Erfahrung, bislang nur unzureichend gelungen ist [1]. Als Verfechter der EBM müssen wir uns also selbstkritisch fragen, was bei deren Implementierung falsch gelaufen ist.

Zunächst wurden bei der „deutschen“ Umsetzung der EBM-Prinzipien praxisnahe und lebendige Inhalte theoretischer und formaler gestaltet, als es je von den EBM-Entwicklern geplant war. Das vorgeschlagene deutsche EBM-Curriculum (als sicher wertvoller Ansatz zur Standardisierung der Lehrinhalte und Qualifikation der Lehrenden), aber auch die Diskussion um die Begriffe von „evidence“ und „Evidenz“ sind nur Beispiele unter vielen, die eher den Bedürfnissen von Erkenntnistheoretikern als von Klinikern gerecht werden [1].

EBM wurde zudem häufig als Gegenpol zur ärztlichen Urteilskraft und Entscheidungsfreiheit dargestellt und führte bei vielen Kollegen zur Angst, fremdbestimmt zu werden [13].

Hinzu kommt, dass die EBM ein populäres Instrument fachfremder Interessengruppen und der Gesundheitspolitik geworden ist, deren Ziele durch die EBM ursprünglich nicht definiert wurden [1].

Des Weiteren reihte sich die EBM in eine Reihe weiterer, auf den ersten Blick praxisferner Themen ein wie Kodierung, DRG („diagnosis related groups“), Qualitätssicherung, Leitlinien, klinische Behandlungspfade u. a., deren praktische Umsetzung zunächst eine weitere Steigerung der täglichen Arbeitslast bedeutete. Bei vielen von uns kam daher die Frage auf, wie viel Zeit ihnen neben administrativen Aufgaben noch für die „eigentliche Arbeit“ im Operationssaal und am Krankenbett bleibt [13].

Neben diesen fachfremden Gegebenheiten existieren unserer Ansicht aber auch spezifische Gründe, warum EBM insbesondere in der Unfallchirurgie eher auf Ablehnung als auf Akzeptanz stößt: Die Besonderheiten chirurgischer Fächer wurden von den Begründern der EBM nur unzureichend berücksichtigt [2, 12].

Randomisierung und Wertigkeit klinischer Studien

Ziel aller Interventionsstudien sind der Nachweis bzw. Ausschluss kausaler Zusammenhänge zwischen der durchgeführten Intervention und dem beobachteten Effekt. In einer klinischen Studie sollten die Behandlungsgruppen qualitativ ähnlich sein, damit der beobachtete Effekt mit möglichst hoher Wahrscheinlichkeit auf die gewählte Intervention zurückgeführt werden kann. In einer randomisierten Studie werden bekannte und v. a. auch unbekannte biologische Störgrößen und Risikogruppen per Zufall auf die zu vergleichenden Gruppen verteilt. Es ist zwar unmöglich, alle Einflussfaktoren auf den Verlauf einer Erkrankung zu kennen; es kann jedoch davon ausgegangen werden, dass durch die zufällige Verteilung von Patienten in 2 oder mehr Behandlungsarme auch eine zufällige Verteilung bekannter und unbekannter Störgrößen erzielt wird. Die tatsächliche Kenntnis dieser Faktoren ist unter der theoretischen Annahme einer balancierten Verteilung nicht erforderlich, systematische Fehler werden aber minimiert. Randomisierung stellt das derzeit beste Verfahren zur Kontrolle klinischer Untersuchungsbedingungen in vergleichenden Studien dar [2, 12].

Vor diesem theoretischen Hintergrund hat sich bei der Bewertung klinischer Studien eine hierarchische Graduierung durchgesetzt (Tab. 1). Für Therapiestudien stellt hierbei nach den Empfehlungen des Centre for Evidence-Based Medicine, Oxford, die Metaanalyse randomisierter Studien mit engem Konfidenzintervall den Referenzstandard dar (so genannte Ia-Evidenz), gefolgt von der randomisierten Studie [5].

Tab. 1 Grad der Empfehlung (A–D) und Evidenzstufen (Ia–V) der Daten unterschiedlicher Studien. (Nach [5])

Der Anteil randomisierter Studien an allen klinischen Studien ist in der Unfallchirurgie im Vergleich zu den nichtoperativen Fächern trotz steigender Tendenz deutlich unterrepräsentiert [2, 12]. Den geringen Anteil randomisierter Studien allein auf methodische Unkenntnis zurückzuführen, wird unserem Fachgebiet sicher nicht gerecht.

Besonderheiten operativer Fächer

Betrachtet man Genese und Therapie von z. B. einer Fraktur und einer koronaren Herzerkrankung, zeigen sich gravierende Unterschiede (Tab. 2). Die Fraktur stellt ein plötzliches Ereignis dar, hervorgerufen durch eine direkte Krafteinleitung. Ist die auf den Knochen einwirkende Kraft (Effektstärke) groß genug, spielen Faktoren wie Alter, Geschlecht und Grunderkrankungen bei der Frakturentstehung nur eine untergeordnete Rolle. Dieses für die Unfallchirurgie typische Beispiel erfüllt im Wesentlichen die von Bradford Hill [9, 10] 1965 vorgeschlagenen Kausalitätsprinzipien:

  • Stärke des Effekts

  • Zeitlicher Zusammenhang

  • Konsistenz

  • Spezifität

  • Plausibilität

  • Intervention

  • Analogie

  • Biologischer Gradient

  • Kohärenz

Während der Zusammenhang zwischen Gewalteinwirkung und Fraktur regelmäßig auf individueller Ebene gelingt, lassen sich Zusammenhänge z. B. zwischen Nikotinabusus und koronarer Herzerkrankung erst in großen Fall-Kontroll-Studien oder Metaanalysen beweisen. Die Anzahl möglicher biologischer Einflussgrößen, die bei einem Raucher eine koronare Herzerkrankung induzieren, bei einem anderen den Nikotinabusus hingegen nahezu folgenlos bleiben lassen, ist unüberschaubar [6].

Operativ-technisches Können

Die operative Intervention ist untrennbar mit der Erfahrung und den technischen Fertigkeiten des ausübenden Operateurs verbunden. In der Regel besitzt der Chirurg eine persönliche Präferenz für bestimmte operative Verfahren [4]; die Beherrschung der einzelnen Operationsschritte geht hiermit einher. Die Ergebnisqualität ist dabei untrennbar mit dem operativen Können verbunden [8]. Die operativ-technische Expertise weist eine typische Lernkurve auf und hat erhebliche Auswirkung auf die Effektivität eines Therapieverfahrens. Bei der Durchführung einer vergleichenden Studie zwischen 2 Operationsverfahren sollten daher alle Operateure sowohl für das experimentelle als auch das Referenzverfahren eine ähnliche Qualifikation aufweisen. Wird diese in der Praxis nur selten gegebene Vorbedingung nicht erfüllt, kann ein systematischer Fehler entstehen [2, 12].

Verblindung

Die Verblindung von Studienteilnehmern und Prüfärzten ist ein wesentliches Qualitätskriterium für die Beurteilung von Interventionsstudien. Aus verständlichen Gründen ist eine solche bei der Durchführung unfallchirurgischer Therapiestudien aber nur in Ausnahmefällen möglich.

A-priori-Wahrscheinlichkeit

Bei der Durchführung eines klinischen Experiments existieren immer Vorkenntnisse, die die Effektivität einer geplanten Intervention wahrscheinlich oder unwahrscheinlich macht. Diese können auf den Daten vorangegangener vergleichender Studien beruhen. Zusätzlich wird die Wahrscheinlichkeit durch die Plausibilität des theoretischen Konstrukts oder der biologischen Wirkung bestimmt [3].

Die A-priori-Wahrscheinlichkeit, dass durch die Therapie einer Schaftfraktur eines langen Röhrenknochens mittels Marknagelosteosynthese zumindest Übungsstabilität erreicht wird, beträgt annähernd 100%. Das chirurgische Prinzip ist biomechanisch so plausibel, dass die Effektivität A priori mit hoher Wahrscheinlichkeit vorhergesagt werden kann. Randomisierte Studien, welche die Stabilität einer Marknagelosteosynthese im Vergleich zur konservativen Therapie von Schaftfrakturen untersuchen, existieren daher berechtigterweise nicht. Demgegenüber ist die A-priori-Wahrscheinlichkeit, dass die Letalität nach einem Herzinfarkt durch die Gabe eines β-Blockers gesenkt wird, aufgrund konkurrierender pathophysiologischer Prinzipien weitaus schwieriger vorherzusagen [12].

Dimension von Therapieeffekten und Störgrößen

Die Wahrscheinlichkeit einer kausalen Beziehung zwischen Intervention und beobachtetem Ergebnis wird unabhängig vom Studiendesign durch die Größe des tatsächlich aufgetretenen Effekts beeinflusst [12].

Die Reposition eines luxierten Schultergelenks erfüllt bezüglich der Zielkriterien Schmerzen und Schulterfunktion die Voraussetzungen des so genannten „Alles-oder-Nichts-Prinzips“, auch als Grad-Ic-Evidenz bezeichnet. Durch die Einrenkung des Gelenks wird dessen Funktion in annähernd allen Fällen wiederhergestellt, ohne Reposition praktisch nie.

Je ähnlicher die Interventionen werden, umso geringer wird der beobachtete Therapieeffekt ausfallen. Im genannten Beispiel kann vorhergesagt werden, dass der therapeutische Unterschied zwischen unterschiedlichen Repositionstechniken gering sein wird.

Je kleiner der Unterschied zwischen verschiedenen Interventionen ist, desto größer werden das Gewicht demografischer, biologischer oder anderer Einflussgrößen und somit die Notwendigkeit, die Studienbedingungen durch Randomisierung zu kontrollieren.

Tab. 2 Allgemeine tendenzielle Unterschiede zwischen Unfallchirurgie und nichtoperativen Fächern. (Nach [12])

Fazit

Evidenzbasierte Unfallchirurgie ist nicht gleichzusetzen mit evidenzbasierter Medizin in der Unfallchirurgie. Der Nachweis einer ursächlichen Beziehung zwischen Intervention und Ergebnis hängt nicht nur vom Studiendesign, sondern auch von anerkannten Kausalitätskriterien, der A-priori-Wahrscheinlichkeit und der Größe des beobachteten Therapieeffekts ab. Die Unfallchirurgie weist hierbei gegenüber den nichtoperativen Fächern spezifische Unterschiede auf, die für die Wahl des Studiendesigns und bei der Evidenzgraduierung berücksichtigt werden müssen.