1. 統計的有意性と臨床的重要性の違い
これまで2回にわたって、p値の正しい意味と、閾値だけで判断することの危険性について学んできました。
最終回となる今回は、米国統計学会(ASA)の原則5と原則6を通じて、「統計的有意性と臨床的重要性の違い」と「p値の限界」について解説します。
そして、p値を補完する重要な指標である「効果量」と「信頼区間」の活用方法を、実践的な例とともにご紹介します。これらの知識は、日々の診療や論文読解において、より良い判断を下すための強力な武器となるでしょう。
2. 血圧1mmHg低下は意味がある?
「p<0.05だから効果が大きい」「p値が小さいほど治療効果も大きい」──このような誤解は、医療現場でも頻繁に見られます。しかし、p値の大小は効果の大きさを直接示すものではありません。
例えば、大規模な臨床試験(各群500人)で血圧を1mmHg下げる効果があった場合、統計的には有意(p<0.001)になる可能性があります。しかし、この1mmHgの差が患者さんにとって意味があるでしょうか?一方、小規模な試験では、臨床的に重要な10mmHgの差があってもp>0.05となることがあります。

このように、統計的有意性と臨床的重要性は別物です。
ASAは「p値単独では、モデルや仮説に対する十分な証拠とはならない」と述べています。
では、私たち医療従事者は、研究結果をどのように評価すべきなのでしょうか。その答えが、効果量と信頼区間の活用にあります。
3. 原則の解説
【原則5】p値は効果の大きさや重要性を示すものではない
p値は主にサンプルサイズとデータのばらつきに影響されます。同じ効果量でも、サンプル数を増やせばいくらでも小さいp値が得られるのです。
具体例を見てみましょう。新薬の嘔吐予防効果で15%の改善(60%→45%)があったとします。この効果量は同じでも、試験規模によってp値は大きく変わります:
・各群100人の場合:p=0.03
・各群500人の場合:p=0.000002
どちらも同じ15%の改善ですが、p値は劇的に異なります。逆に、サンプル数が少なければ、臨床的に重要な差があってもp>0.05となることがあります。
したがって、研究結果を評価する際は、p値だけでなく「効果量(どれくらいの差があったか)」と「95%信頼区間(真の効果がどの範囲にあるか)」を必ず確認しましょう。これらの情報があって初めて、その治療が患者さんにとって価値があるかを判断できるのです。
【原則6】p値単独では十分な証拠とならない
p値はそれだけで強力な証拠とは言えません。「p>0.05だから効果なし」という結論も、「p<0.05だから確実に効果あり」という結論も、どちらも不適切です。
★実際、p値が大きくても(=有意差なし)、以下の可能性があります:
・検出力不足で効果を見逃している
・効果はあるが、サンプル数が少なくて検出できない
・測定精度が低くて真の効果が隠れている
★逆に、p値が小さくても(=有意差あり):
・偶然の結果かもしれない(特に多重検定の場合)
・統計的には有意でも臨床的には無意味かもしれない
・研究デザインの欠陥による見かけ上の効果かもしれない
そのため、p値は他の情報と組み合わせて解釈する必要があります。効果量、信頼区間、先行研究との一致性、生物学的妥当性など、総合的に評価することが重要です。
4.【実践:p値を超えた評価方法】
医療現場でp値と適切に付き合うための実践的なアプローチをまとめます:
- 効果量と信頼区間を重視する
例:「降圧薬Aは収縮期血圧を平均8mmHg低下させた(95%信頼区間:5-11mmHg、p=0.03)」
この情報から、最悪でも5mmHg、最良で11mmHgの効果が期待できることがわかります。 - 臨床的意義を優先する
たとえp<0.05でも、その差が患者さんにとって意味があるか常に考えましょう。
逆にp>0.05でも、臨床的に重要な可能性があれば追加検証の価値があります。 - 研究の透明性を確保する
解析計画を事前に登録し、すべての結果を報告しましょう。
これにより、pハッキングを防ぎ、信頼性の高いエビデンスを構築できます。 - 複数の研究を総合的に評価する
一つの研究結果に頼らず、メタアナリシスや系統的レビューを参考にしましょう。
5. まとめ
3回にわたってASAの6原則を学んできました。
p値は有用なツールですが、万能ではありません。効果量と信頼区間を併せて評価し、統計的有意性と臨床的重要性を区別することが、質の高い医療を提供する鍵となります。
「p<0.05」の呪縛から解放され、本当に患者さんのためになる医療を実践していきましょう。
参考文献
- Wasserstein RL, et al. The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician. 2016;70(2):129-133.
DOI: 10.1080/00031305.2016.1154108 - Amrhein V, et al. Scientists rise up against statistical significance. Nature. 2019;567(7748):305-307.
DOI: 10.1038/d41586-019-00857-9 - Ioannidis JPA. Why Most Published Research Findings Are False. PLoS Med. 2005;2(8):e124.
DOI: 10.1371/journal.pmed.0020124






