BfArM - Bundesinstitut für Arzneimittel und Medizinprodukte

Navigation und Service

Anforderungen zur Statistik bei Anträgen auf Genehmigung einer klinischen Prüfung mit Medizinprodukten

Die Statistik spielt bei der Planung, Durchführung und Auswertung einer klinischen Prüfung von Medizinprodukten eine entscheidende Rolle, um die Sicherheit und Effektivität der Produkte belegen zu können. Um dieser Bedeutung gerecht zu werden, ist die Statistik sowohl in nationalen Gesetzen und Verordnungen als auch in harmonisierten Normen als essentieller Bestandteil einer klinischen Prüfung vorgeschrieben und verankert.

Normative Grundlagen

In Anlehnung an die einschlägigen Normen (DIN EN ISO 14155: Klinische Prüfung von Medizinprodukten an Menschen) muss die Statistik einer klinischen Prüfung den Ansprüchen der Wissenschaftlichkeit genügen. Aus diesem Grund wurden in die DIN ISO 14155 entsprechende Abschnitte aufgenommen. Die Bundesoberbehörde empfiehlt folgende Punkte bei der Planung der Statistik zu berücksichtigen:

Erforderliche Angaben im Prüfplan

  1. Anzunehmende oder abzulehnende Primär- und Sekundärhypothesen

    In der Regel sollte die Alternativhypothese das Kompliment der Nullhypothese beschreiben.

    Hier ist zwischen einer exploratorischen (einer frühen Phase) und einer konfirmatorischen Studie zu unterscheiden. Eine exploratorische Studie kann (muss aber nicht) auch auf einen statistischen Test und damit auf eine Nullhypothese verzichten.

    In einer konfirmatorischen Studie ist es wichtig die Anzahl der Primärhypothesen auf ein Minimum zu beschränken. In der Regel leitet sich aus den Primärhypothesen das „Erfolgskriterium“ der Studie ab , z.B. die Wirkung gilt als belegt, falls die Primärhypothese(n) abgelehnt wurde(n).

    Bei der Formulierung der Nullhypothesen ist es wichtig, diese exakt unter Angabe der entsprechenden Verteilungsparameter (z.B. Populationsmittelwerte) zu definieren. Die Formulierung muss eindeutig sein, da eine nachträgliche Auswahl der exakten Nullhypothese das wahre Signifikanzniveau erhöhen würde und damit die Validität des statistischen Tests verloren gehen würde.

  2. Angaben über die statistische Ausführung, das Verfahren und die analytischen Verfahren

    In einer konfirmatorischen Studie müssen die anzuwendenden statistischen Tests bzw. analytischen Verfahren exakt und eindeutig angegeben werden, da wiederum eine nachträgliche Auswahl das wahre Signifikanzniveau erhöhen würde.

    Die Populationen der Auswertung: ITT (Intention-To-Treat population bzw. das Full-Analysis-Set), PP (per protocol: Studienpopulation unter Aus-schluss der Protokollverletzer) und u.U. weitere z.B. ein Safety-Data-Set.
    Es sollte beschrieben werden auf welcher Population die primäre Analyse erfolgt (in einer konfirmatorischen Studie auf der ITT-Population) und wie die Populationen genau definiert sind. Für die PP-population müssen die möglichen Protokollverletzungen genau aufgelistet werden.

  3. Fallzahlplanungen

    Fallzahlplanung: Angaben zu Power, erwarteter bzw. gewünschter Behandlungseffekt, angenommene Variabilität, Drop-out Rate
    Das Signifikanzniveau sollte primär angegeben werden.
    Welche Fallzahl wird benötigt, um die primäre Nullhypothese mit vorgegebener Wahrscheinlichkeit abzulehnen unter Annahme eines bestimmten Behandlungseffektes und Variabilität der Daten? Kompliziertere statistische Modelle erfordern weitere Angaben.

  4. das Signifikanzniveau und die Aussagekraft der klinischen Prüfung
    Das Signifikanzniveau wird in der Regel zu 5% angesetzt. In Allgemeinen bezieht sich das Signifikanzniveau auf einen zweiseitigen Test bzw. Hypo-thesen (z.B. Mittelwerte gleich versus Mittelwerte verschieden). Einseitige Tests bzw. Hypothesen (z.B. Mittelwert1 </= Mittelwert2 vs B. Mittelwert1 > Mittelwert2) sind die Ausnahmen. In den meisten Fällen entspricht der zweiseitige Test zum Niveau 5% dem entsprechenden einseitigen Test zum Niveau 2.5%.
  5. Drop-out Raten

    Angaben über die erwarteten Drop-out Raten. Unter Umständen ist auch die Angabe der drop-out-Inzidenz also pro Zeiteinheit sinnvoll.

  6. Anzuwendende Bestehens-/Versagenskriterien

    Kriterien die zum Ablehnen der primären Nullhypothesen führen. Mehrere Nullhypothesen können eine genauere Formulierung erfordern.

  7. Angaben zu geplanten Zwischenauswertungen,
    Interimanalysen und adaptive Designs: Interimanalysen, die daraus resultierenden Entscheidungen und Entscheidungsregeln sollten möglichst genau beschrieben werden. Der aus dem Design resultierende Fehler 1. Art muss das Signifikanzniveau einhalten, so dass das nominale Niveau für Interim- und Endauswertung u.U. entsprechend angepasst werden muss. Die Adjustierung muss hierzu beschrieben werden.
    Erfolgt die Interimauswertung verblindet, d.h. ohne Aufdeckung der randomisierten Behandlungen oder unverblindet. Im letzten Fall muss sichergestellt werden, dass die gewonnene Information nur dem kleinen Kreis der an der Zwischenauswertung Beteiligten zugänglich ist. Insbesondere eine konfirmatorische Studie kann ein externes Data Monitoring Commitee (DMC) erforderlich machen. Dessen Zusammensetzung und Aufgaben, die

    Realisierung der Entscheidungsregeln müssen beschrieben werden. Dies sollte idealerweise in einer DMC-Charter präzisiert werden.

  8. die Kriterien für einen aus Gründen der Probandensicherheit notwendigen Abbruch der Prüfung

    z.B. Kummulation von SAEs. Fehlender Nachweis der Sicherheit in der Zwischenauswertung.

  9. Anweisungen für den Bericht über alle Abweichungen von der ursprünglichen statistischen Planung

    Amendments müssen genau dokumentiert, begründet und datiert werden. Nach Entblindung, d.h. Datenbankschluss können keine Amendments mehr festgelegt werden. Die Auswirkung auf die Validität der Studie sollte beschrieben werden.

  10. Spezifikation der Auswertung von Subgruppen
  11. die Anweisungen für die Dokumentation aller Daten
  12. die Behandlung fehlender, nicht verwendeter oder verfälschten Daten, einschließlich von Ausfällen und Zurückziehungen einzelner Versuchspersonen,

Im Rahmen eine ITT-Analyse müssen fehlende Daten sinnvoll ersetzt werden. Dies sollte möglichst „konservativ“ geschehen.

  1. eine Begründung für die Nichtberücksichtigung einzelner Informationen bei der Hypothesenprüfung, sofern zutreffend
  2. bei multizentrischen Prüfungen, die Mindest- und Höchstzahl an einzubeziehenden Versuchspersonen für jedes Prüfzentren
    Eine Mindest- und Höchstzahl kann i.A. nicht vorgegeben werden. Das Design sollte aber eine Analyse von Zentrumseffekten bzw. Behandlungsunterschieden zwischen den Zentren, Ländern oder Regionen erlauben. Unter Umständen müssen kleinere Zentren gepoolt werden. Die Regel hierzu sollte im Prüfplan (oder im statistischen Analyseplan) beschrieben werden.