★で始まるブログは一部医療従事者向けの内容を含みます。詳しくは「このサイトについて」をごらんください。

★【p値の正体:第3回】p値を超えて:効果量と信頼区間で見る本当の臨床的価値

1. 統計的有意性と臨床的重要性の違い

 これまで2回にわたって、p値の正しい意味と、閾値だけで判断することの危険性について学んできました。

 最終回となる今回は、米国統計学会(ASA)の原則5と原則6を通じて、「統計的有意性と臨床的重要性の違い」「p値の限界」について解説します。

 そして、p値を補完する重要な指標である「効果量」と「信頼区間」の活用方法を、実践的な例とともにご紹介します。これらの知識は、日々の診療や論文読解において、より良い判断を下すための強力な武器となるでしょう。

2. 血圧1mmHg低下は意味がある?

「p<0.05だから効果が大きい」「p値が小さいほど治療効果も大きい」──このような誤解は、医療現場でも頻繁に見られます。しかし、p値の大小は効果の大きさを直接示すものではありません。

 例えば、大規模な臨床試験(各群500人)で血圧を1mmHg下げる効果があった場合、統計的には有意(p<0.001)になる可能性があります。しかし、この1mmHgの差が患者さんにとって意味があるでしょうか?一方、小規模な試験では、臨床的に重要な10mmHgの差があってもp>0.05となることがあります。

 このように、統計的有意性と臨床的重要性は別物です。

 ASAは「p値単独では、モデルや仮説に対する十分な証拠とはならない」と述べています。

 では、私たち医療従事者は、研究結果をどのように評価すべきなのでしょうか。その答えが、効果量と信頼区間の活用にあります。

3. 原則の解説

【原則5】p値は効果の大きさや重要性を示すものではない

 p値は主にサンプルサイズとデータのばらつきに影響されます。同じ効果量でも、サンプル数を増やせばいくらでも小さいp値が得られるのです。

 具体例を見てみましょう。新薬の嘔吐予防効果で15%の改善(60%→45%)があったとします。この効果量は同じでも、試験規模によってp値は大きく変わります:
・各群100人の場合:p=0.03
・各群500人の場合:p=0.000002

 どちらも同じ15%の改善ですが、p値は劇的に異なります。逆に、サンプル数が少なければ、臨床的に重要な差があってもp>0.05となることがあります。

 したがって、研究結果を評価する際は、p値だけでなく「効果量(どれくらいの差があったか)」「95%信頼区間(真の効果がどの範囲にあるか)」を必ず確認しましょう。これらの情報があって初めて、その治療が患者さんにとって価値があるかを判断できるのです。

【原則6】p値単独では十分な証拠とならない

 p値はそれだけで強力な証拠とは言えません。「p>0.05だから効果なし」という結論も、「p<0.05だから確実に効果あり」という結論も、どちらも不適切です。

★実際、p値が大きくても(=有意差なし)、以下の可能性があります:
検出力不足で効果を見逃している
・効果はあるが、サンプル数が少なくて検出できない
測定精度が低くて真の効果が隠れている

★逆に、p値が小さくても(=有意差あり):
偶然の結果かもしれない(特に多重検定の場合)
・統計的には有意でも臨床的には無意味かもしれない
研究デザインの欠陥による見かけ上の効果かもしれない

 そのため、p値は他の情報と組み合わせて解釈する必要があります。効果量、信頼区間、先行研究との一致性、生物学的妥当性など、総合的に評価することが重要です。

4.【実践:p値を超えた評価方法】

 医療現場でp値と適切に付き合うための実践的なアプローチをまとめます:

  1. 効果量と信頼区間を重視する
    例:「降圧薬Aは収縮期血圧を平均8mmHg低下させた(95%信頼区間:5-11mmHg、p=0.03)」
    この情報から、最悪でも5mmHg、最良で11mmHgの効果が期待できることがわかります。
  2. 臨床的意義を優先する
    たとえp<0.05でも、その差が患者さんにとって意味があるか常に考えましょう。
    逆にp>0.05でも、臨床的に重要な可能性があれば追加検証の価値があります。
  3. 研究の透明性を確保する
    解析計画を事前に登録し、すべての結果を報告しましょう。
    これにより、pハッキングを防ぎ、信頼性の高いエビデンスを構築できます。
  4. 複数の研究を総合的に評価する
    一つの研究結果に頼らず、メタアナリシスや系統的レビューを参考にしましょう。

5. まとめ

 3回にわたってASAの6原則を学んできました。

 p値は有用なツールですが、万能ではありません。効果量と信頼区間を併せて評価し、統計的有意性と臨床的重要性を区別することが、質の高い医療を提供する鍵となります。

 「p<0.05」の呪縛から解放され、本当に患者さんのためになる医療を実践していきましょう。

参考文献

  • Wasserstein RL, et al. The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician. 2016;70(2):129-133.
    DOI: 10.1080/00031305.2016.1154108
  • Amrhein V, et al. Scientists rise up against statistical significance. Nature. 2019;567(7748):305-307.
    DOI: 10.1038/d41586-019-00857-9
  • Ioannidis JPA. Why Most Published Research Findings Are False. PLoS Med. 2005;2(8):e124.
    DOI: 10.1371/journal.pmed.0020124

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)