Klinische Studien richtig lesen |
06.02.2007 12:14 Uhr |
<typohead type="3">Klinische Studien richtig lesen
Von Sven Siebenand, Frankfurt am Main
Klinische Studien bilden oft die Grundlage für Therapieentscheidungen. Nicht immer halten Qualität und Vergleichbarkeit einer genauen Untersuchung stand. Anhand weniger Anhaltspunkte können Methodik, Ergebnisse und damit Qualität und Relevanz einer Studie besser eingeschätzt werden.
»Onkologische Studien sind extrem komplex und weisen Besonderheiten auf, die es zu beachten gilt«, sagte Dr. Petra Schiller vom Institut für Medizinische Biometrie und Informatik der Universität Heidelberg im Rahmen eines Onkologie-Kolloquiums des Pharmaunternehmens Lilly. Dazu zähle zum Beispiel, dass in der Onkologie der therapeutische Erfolg sehr begrenzt ist, die Behandlung reich an Nebenwirkungen ist und eine Placebogruppe meist ethisch nicht vertretbar ist.
Als Goldstandard bezeichnete Schiller kontrollierte randomisierte Doppelblindstudien (siehe Glossar). Zudem sei ein sorgfältiges Studiendesign das A und O. Diese zeichne sich durch ein klar definiertes Studienziel, zu Beginn festgelegte Zielkriterien und eine statistisch auswertbare Fallzahlgröße aus. Einen ersten Eindruck könne man sich über die Darstellung der Studienpopulation verschaffen. So sei das sogenannte Flow Chart nach CONSORT, die Auskunft über alle in die Studie aufgenommenen Patienten sowie die Dokumentation des Studienverlaufs mit Gründen für Abweichungen oder Therapieabbruch (drop out) von großer Bedeutung. Zudem riet Schiller, auch die Patientencharakteristika zu vergleichen. Wichtige Basisdaten wie Geschlecht, Altersstruktur und Krankheitsstadium sollten in den Vergleichsgruppen ausgeglichen sein.
klinisch: Patienten als Grundlage der Untersuchung
kontrolliert: mindestens eine Behandlungsgruppe ist eine Kontrolle (Placebo, Standardmedikation)
randomisiert: zufällige Zuteilung der Patienten zur Behandlungsgruppe
doppelblind: Behandlungsgruppe ist weder dem Patienten noch dem Arzt bekannt
multizentrisch: Beteiligung mehrerer Kliniken oder Praxen
prospektiv: Datenerhebung beginnt, bevor die interessierenden Ereignisse eingetreten sind
RCT-Studie: randomisierte kontrollierte Studie (randomized controlled trial)
»Im Studienprotokoll muss vorab festgelegt werden, was Haupt- und was Nebenfragestellung ist«, so die Biometrikerin. In vergleichenden Therapiestudien könne immer nur eine Fragestellung konfirmatorisch, das heißt mit statistischer Sicherheit geprüft werden. Diese Hauptfrage müsse in Form einer Hypothese vorab formuliert sein. Nebenfragestellungen und Subgruppenanalysen gäben dagegen allenfalls Hinweise für etwaige weitere Studien, Einfluss auf die Testentscheidung hätten sie aber nicht.
»Harte« Endpunkte festlegen
Die antitumorale Aktivität und damit die Wirkung werde in der Onkologie typischerweise in Phase-II-Studien untersucht. »Wirkung darf nicht mit Wirksamkeit verwechselt werden«, betonte Schiller. Letztere werde zum Beispiel in sogenannten Überlegenheits-Studien in der Phase III untersucht. Die Zeit bis zum Auftreten eines bestimmten Ereignisses ist in onkologischen Studien eine wichtige Größe, um die Wirksamkeit einer Therapie zu beurteilen. Als härtestes Zielkriterium bezeichnete Schiller das Gesamtüberleben (OS = overall survival), da es Todesfälle jeglicher Ursache berücksichtigt. Üblich und erlaubt sei aber auch das Kriterium progressionsfreies Überleben (PFS = progression free survival). Als weniger aussagekräftig stufte die Referentin die Angabe der Zeit bis zur Tumorprogression (TTP = time to tumor progression) ein, da bei diesem Kriterium Todesfälle ohne Fortschreiten des Tumors nicht berücksichtigt werden.
Nach einer radiologischen Untersuchung wird die Ansprechrate (Tumorresponse) beurteilt und in ein Vierstufensystem einsortiert. Danach bedeuten:
Complete Response (CR): komplettes Verschwinden aller bekannten Tumorparameter (Bestätigung nach vier Wochen)
Partial Response (PR): Rückgang der messbaren Tumorparameter um mehr als 30 Prozent (Bestätigung nach vier Wochen)
Progressive Disease (PD): mehr als 20 Prozent Größenzunahme der bekannten Läsionen beziehungsweise Auftreten neuer Läsionen
Stable Disease (SD): weder CR noch PR noch PD
Da nicht immer eindeutig ist, was Tumorgewebe und was vernarbtes Gewebe ist, sei die Angabe der Tumorresponserate nur ein weiches Kriterium. Daher empfahl Schiller, zusätzlich sekundäre Endpunkte wie Überleben und Toxizität anzuschauen.
Evidenzbasiert statt eminenzbasiert
Von großer Bedeutung sei auch die Darstellung der Testergebnisse. Die alleinige Angabe der Irrtumswahrscheinlichkeit (p-Wert) habe nur begrenzte Aussagekraft. »Mit großen Fallzahlen kann man auch geringe Unterschiede als statistisch signifikant herausfinden«, informierte Schiller. Statistisch signifikant heiße aber nicht zwingend auch klinisch relevant. Deshalb gehöre es zum guten Ton, neben dem p-Wert immer auch das Konfidenzintervall (KI) anzugeben. Damit könne die klinische Relevanz dann abgeschätzt werden.
Das Evidenzklassen-System dient dazu, die Beweiskraft einer Studie einzuschätzen. Danach haben systematische Reviews auf der Basis mehrerer hochwertiger kontrollierter randomisierter Studien (Stufe Ia) die höchste Beweiskraft. Es folgen Evidenz aufgrund von mindestens einer randomisierten, kontrollierten Studie (Stufe Ib) sowie Evidenz aufgrund von mindestens einer kontrollierten, jedoch nicht randomisierten Studie (Stufe IIa). Am unteren Ende der Skala rangieren Meinungen und Überzeugungen von angesehenen Autoritäten, Expertenkommissionen und beschreibende Studien (Stufe IV). »Evidenzbasiert geht immer vor eminenzbasiert«, fasste Schiller zusammen.