Artikel herunterladen

Wichtige Hinweise zur Beurteilung von Nichtunterlegenheitsstudien

Die meisten randomisierten kontrollierten Studien zielen auf den Nachweis, dass eine neue medizinische Behandlung einer Standardtherapie oder Plazebo überlegen ist (Überlegenheitsstudie). Zunehmend werden Nichtunterlegenheitsstudien durchgeführt, die demgegenüber den Nachweis erbringen sollen, dass die Wirksamkeit einer neuen medizinischen Behandlung gegenüber einer anderen allenfalls in gewissen, vor Studienbeginn definierten Grenzen schlechter abschneidet. Dazu muss schon bei der Planung der Studie eine Nichtunterlegenheitsgrenze festgelegt werden, oberhalb derer eine Maßnahme als mindestens gleichwertig bewertet wird (1-3). Nichtunterlegenheitsstudien werden in der Vorstellung durchgeführt, dass eine Behandlung in bestimmten Aspekten der Standardtherapie überlegen ist, beispielsweise hinsichtlich niedrigerer Kosten, weniger Nebenwirkungen oder einer einfacheren Anwendung. Diese Aspekte werden in Nichtunterlegenheitsstudien jedoch gewöhnlich nicht untersucht. Eine Nichtunterlegenheitsstudie, die auch in der Laienpresse Aufsehen erregt hat, ist die vom staatlichen US-amerikanischen National Eye Institute geförderte CATT-Studie. In der Studie wurde nachgewiesen, dass Bevacizumab (Avastin®) in der Behandlung der feuchten Makuladegeneration dem sehr teuren Ranibizumab (Lucentis®) nicht unterlegen ist (4, vgl. 5). Mit der Aussicht auf eine bessere Verträglichkeit werden Deeskalationsstudien in der Onkologie oft als Nichtunterlegenheitsstudie angelegt (6). Ethisch häufig fragwürdig werden jedoch statt der eigentlich benötigten Überlegenheitsstudien auch Zulassungsstudien von Arzneimitteln als Nichtunterlegenheitsstudien durchgeführt, um „Me-too“-Präparate ohne relevante Vorteile zu vermarkten. Dafür werden beispielsweise die tolerierten Grenzen so weit gewählt, dass trotz klinisch relevanter Nachteile formal eine „Nichtunterlegenheit“ ermittelt wird (7-9). Aufeinander folgende Nichtunterlegenheitsstudien können eine zunehmend weniger wirksame Behandlung als Standardtherapie einführen, obwohl Nichtunterlegenheit gezeigt wurde.

In Nichtunterlegenheitsstudien können Abweichungen vom Studienprotokoll Unterschiede zwischen den Behandlungsarmen verschleiern und solche Ergebnisse begünstigen, die Nichtunterlegenheit zeigen. Deshalb wird für Nichtunterlegenheitsstudien empfohlen, sowohl eine Intention-To-Treat (ITT)-Analyse durchzuführen als auch eine Per-Protocol (PP)-Analyse (10). Dies wird an einem Beispiel verständlich: Man stelle sich eine sehr schlechte Studie vor, in der sowohl die Standardtherapie als auch die neue Behandlung gleichmäßig auf die Studiengruppen verteilt waren. Bei Überlegenheitsstudien gäbe es nun wahrscheinlich keinen nachweisbaren Unterschied, und die Überlegenheit der neuen Behandlung würde abgelehnt. Bei einer Nichtunterlegenheitsstudie könnte das Fehlen eines Unterschieds so interpretiert werden, dass die neue Behandlung der Standardtherapie nicht unterlegen ist. Deswegen sollte Nichtunterlegenheit sowohl mit der ITT- als auch mit der PP-Analyse nachgewiesen werden (11).

Mangelnde Adhärenz zu der zugeteilten Behandlung ist ein besonders wichtiges Problem bei Nichtunterlegenheitsstudien, wie eine aktuelle Publikation darstellt (12). Die Autoren weisen darauf hin, dass mangelnde Adhärenz im Unterschied zur Zuteilung zu einem Behandlungsarm oft nicht zufällig erfolgt, sondern von Störfaktoren abhängt. Beispielsweise könnten in einer offenen Studie schwerer erkrankte Patienten aus dem Arm mit der experimentellen Behandlung in den Arm mit der Standardtherapie wechseln, während leichter erkrankte Patienten eher bereit sein könnten, eine experimentelle Behandlung durchzuführen. Die Schwere der Krankheit kann in diesem Fall als Störfaktor wirken und die Auswertung verzerren. Die Autoren empfehlen, die Adhärenz der Studienteilnehmer möglichst genau zu erfassen. In Arzneimittelstudien, in denen das Medikament nicht unter Aufsicht eingenommen wird, kann dies beispielsweise durch Fragebögen oder das sogenannte „Pillenzählen“ erfolgen. Außerdem sollten potenzielle Störfaktoren vorab benannt werden, um relevante und vollständige Daten sowohl von adhärenten als auch von nicht adhärenten Teilnehmern während der Studie zu sammeln. Für die Auswertung der Studie schlagen die Autoren spezielle statistische Verfahren vor (Methoden der kausalen Interferenz), um Verzerrungen und das Risiko für falsche Aussagen hinsichtlich der Nichtunterlegenheit zu minimieren.

Zur Beurteilung der Ergebnisse von Nichtunterlegenheitsstudien können beispielsweise folgende Kriterien hilfreich sein:

  • Rechtfertigt die Fragestellung die Durchführung einer Nichtunterlegenheitsstudie oder wäre eine Überlegenheitsstudie angemessen?

  • Ist belegt, dass die Behandlung, mit der die neue Behandlung verglichen wird, wirksam ist, d.h. besser wirksam als Plazebo?

  • Entsprechen die Patienten der Studie den Patienten, für die eine Wirksamkeit der Standardtherapie belegt wurde?

  • Sind die Endpunkte geeignet, Unterschiede zwischen den Behandlungen erkennen zu lassen oder besteht die Gefahr, dass sie durch Störfaktoren verfälscht werden?

  • Wurden die Nichtunterlegenheitsgrenzen bereits bei der Planung der Studie, d.h. ohne Kenntnis der Daten festgelegt?

  • Gibt es eine nachvollziehbare Begründung für die Festlegung der Nichtunterlegenheitsgrenzen?

  • Wird die Adhärenz der Teilnehmer sorgfältig dokumentiert?

  • Ist die Nachbeobachtungszeit lang genug, um relevante Unterschiede zwischen den Behandlungen zeigen zu können?

Fazit: Wird in einer Nichtunterlegenheitsstudie festgestellt, dass eine neue Behandlung einer Standardtherapie nicht unterlegen ist, bedeutet dies nicht, dass die Behandlungen gleichwertig oder ähnlich gut sind, sondern lediglich, dass die neue Behandlung zuvor festgelegte Nichtunterlegenheitsgrenzen nicht unterschreitet. Nichtunterlegenheitsstudien sind anfällig für Verzerrungen. Beispielsweise verringert mangelnde Adhärenz der Studienteilnehmer typischerweise die beobachteten Behandlungseffekte in den jeweiligen Studienarmen und führt zu einer höheren Wahrscheinlichkeit, dass die neue Behandlung im Vergleich zur Standardtherapie als nicht unterlegen erscheint.

Literatur

  1. https://www.ema.europa.eu/ en/documents/scientific-guideline/ guideline-choice-non-inferiority-margin_en.pdf Link zur Quelle
  2. https://www.iqwig.de/de/glossar.2727.html Link zur Quelle
  3. Wellek, S., und Blettner, M.: Dtsch. Arztebl. Int. 2012, 109, 674. Link zur Quelle
  4. The CATT Research Group (Comparison of Age-related macular degeneration Treatment Trials): N. Engl. J. Med. 2011, 364, 1897. Link zur Quelle
  5. AMB 2020, 54, 45. Link zur Quelle AMB 2012, 46, 72DB01 Link zur Quelle .
  6. Kurzrock, R., et al.: Nature Rev. Clin. Oncol. 2020, 17, 140. Link zur Quelle
  7. Eichler, H.-G., et al.: Nature Reviews Drug Discovery 2019, 18, 651. Link zur Quelle
  8. Garattini, S., und Bertelé, V.: Lancet 2007, 370, 1875. Link zur Quelle
  9. https://www.arznei-telegramm.de/html/2009_11/0911093_02.html Link zur Quelle
  10. Leung, J.T., et al.: Heart 2020, 106, 99. Link zur Quelle
  11. Brasher, P.M.A., und Dobson, G.: Can. J. Anesth. 2014, 61, 389. Link zur Quelle
  12. Mo, Y., et al.: BMJ 2020, 369, m2215. Link zur Quelle