感染症領域では非劣性試験が増えてきているらしいが、循環器領域でも、最近NOACsがワルファリンに対し非劣性を証明云々という感じで、非劣性試験についてよく耳にする。ということで、以下のサイトでお勉強したことをまとめる。
感染症医のための非劣性試験の読み方
今日から使える医療統計講座 同等性・非劣性の解析
臨床試験を斬る 非劣性試験
優越性を示す試験は、帰無仮説を用いている。帰無仮説=群間に差がないという仮説で、それを否定することで、差がなくない ⇒ 差があるという論理が展開され、優越性が証明される。ちなみに、P<0.05であれば、常識的に群間差があるという解釈できる。統計学的有意差がなかった場合(Pが0.05を超えている場合)には、群間に差があるとは言えないわけだが、それはすなわち同等ということではない。本当に差がないか、あるいはサンプルサイズが小さいかを検証しなければならない。 標準的治療法がすでに確立されている疾患であれば、標準的治療を対照にして、それに対し優越性を示すことは難しい。そこで、行われるのが非劣性試験である。非劣性試験とは、既存の治療と比較してそれほど劣らないことを証明する試験である。「それほど」というのがミソで、非劣性マージンと呼ばれ、非劣性が証明された治療は、対照となっている治療よりも最大で、非劣性マージン分だけ劣る可能性がある。なので、非劣性マージンは「臨床的に許容される最大のレベル」で設定されることになる。 非劣性が証明されても、基準治療よりちょっとだけ劣る可能性があるので、それを上回るメリット(コストが低い、投与方法が簡便、副作用が少ないなど)がなくてはならない。 非劣性試験におけるアウトカムの評価尺度は、基準治療の有効性が確立された試験と同等でなければならない。そうでなければ、非劣性試験を繰り返した場合、論理的には基準治療に対し非劣性ということになるが、実際はプラセボよりも劣ってしまう「bio-creep」が起こる可能性がある。 非劣性試験では、非劣性マージンのほかに分析感度も重要である。非劣性マージンを超えて群間に差があるという仮定を否定することにより証明するので、差が薄まることは有利に働いてしまう。ITT(intention to treat)解析とper protocol解析を同時に行うことが望ましい。両方の解析で同じ結論がでれば、結果の信頼性は高くなる。