1. 統計的有意性と臨床的重要性の違い

　これまで2回にわたって、p値の正しい意味と、閾値だけで判断することの危険性について学んできました。

★【p値の正体：第1回】p値の落とし穴：なぜ「p<0.05」だけで判断してはいけないのか

★【p値の正体：第2回】統計的有意差の罠：効果の大きさと臨床的価値を見極める

　最終回となる今回は、米国統計学会（ASA）の原則5と原則6を通じて、「統計的有意性と臨床的重要性の違い」と「p値の限界」について解説します。

　そして、p値を補完する重要な指標である「効果量」と「信頼区間」の活用方法を、実践的な例とともにご紹介します。これらの知識は、日々の診療や論文読解において、より良い判断を下すための強力な武器となるでしょう。

2. 血圧1mmHg低下は意味がある？

「p<0.05だから効果が大きい」「p値が小さいほど治療効果も大きい」──このような誤解は、医療現場でも頻繁に見られます。しかし、p値の大小は効果の大きさを直接示すものではありません。

　例えば、大規模な臨床試験（各群500人）で血圧を1mmHg下げる効果があった場合、統計的には有意（p<0.001）になる可能性があります。しかし、この1mmHgの差が患者さんにとって意味があるでしょうか？一方、小規模な試験では、臨床的に重要な10mmHgの差があってもp>0.05となることがあります。

　このように、統計的有意性と臨床的重要性は別物です。

　ASAは「p値単独では、モデルや仮説に対する十分な証拠とはならない」と述べています。

　では、私たち医療従事者は、研究結果をどのように評価すべきなのでしょうか。その答えが、効果量と信頼区間の活用にあります。

3. 原則の解説

【原則5】p値は効果の大きさや重要性を示すものではない

　p値は主にサンプルサイズとデータのばらつきに影響されます。同じ効果量でも、サンプル数を増やせばいくらでも小さいp値が得られるのです。

　具体例を見てみましょう。新薬の嘔吐予防効果で15％の改善（60％→45％）があったとします。この効果量は同じでも、試験規模によってp値は大きく変わります：
・各群100人の場合：p=0.03
・各群500人の場合：p=0.000002

　どちらも同じ15％の改善ですが、p値は劇的に異なります。逆に、サンプル数が少なければ、臨床的に重要な差があってもp>0.05となることがあります。

　したがって、研究結果を評価する際は、p値だけでなく「効果量（どれくらいの差があったか）」と「95％信頼区間（真の効果がどの範囲にあるか）」を必ず確認しましょう。これらの情報があって初めて、その治療が患者さんにとって価値があるかを判断できるのです。

【原則6】p値単独では十分な証拠とならない

　p値はそれだけで強力な証拠とは言えません。「p>0.05だから効果なし」という結論も、「p<0.05だから確実に効果あり」という結論も、どちらも不適切です。

★実際、p値が大きくても（＝有意差なし）、以下の可能性があります：
・検出力不足で効果を見逃している
・効果はあるが、サンプル数が少なくて検出できない
・測定精度が低くて真の効果が隠れている

★逆に、p値が小さくても（＝有意差あり）：
・偶然の結果かもしれない（特に多重検定の場合）
・統計的には有意でも臨床的には無意味かもしれない
・研究デザインの欠陥による見かけ上の効果かもしれない

　そのため、p値は他の情報と組み合わせて解釈する必要があります。効果量、信頼区間、先行研究との一致性、生物学的妥当性など、総合的に評価することが重要です。

4.【実践：p値を超えた評価方法】

　医療現場でp値と適切に付き合うための実践的なアプローチをまとめます：

効果量と信頼区間を重視する
例：「降圧薬Aは収縮期血圧を平均8mmHg低下させた（95％信頼区間：5-11mmHg、p=0.03）」
この情報から、最悪でも5mmHg、最良で11mmHgの効果が期待できることがわかります。
臨床的意義を優先する
たとえp<0.05でも、その差が患者さんにとって意味があるか常に考えましょう。
逆にp>0.05でも、臨床的に重要な可能性があれば追加検証の価値があります。
研究の透明性を確保する
解析計画を事前に登録し、すべての結果を報告しましょう。
これにより、pハッキングを防ぎ、信頼性の高いエビデンスを構築できます。
複数の研究を総合的に評価する
一つの研究結果に頼らず、メタアナリシスや系統的レビューを参考にしましょう。

5. まとめ

　3回にわたってASAの6原則を学んできました。

　p値は有用なツールですが、万能ではありません。効果量と信頼区間を併せて評価し、統計的有意性と臨床的重要性を区別することが、質の高い医療を提供する鍵となります。

　「p<0.05」の呪縛から解放され、本当に患者さんのためになる医療を実践していきましょう。

参考文献

Wasserstein RL, et al. The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician. 2016;70(2):129-133.
DOI: 10.1080/00031305.2016.1154108
Amrhein V, et al. Scientists rise up against statistical significance. Nature. 2019;567(7748):305-307.
DOI: 10.1038/d41586-019-00857-9
Ioannidis JPA. Why Most Published Research Findings Are False. PLoS Med. 2005;2(8):e124.
DOI: 10.1371/journal.pmed.0020124

月	火	水	木	金	土	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

耳鼻咽喉科医の独り言

★【p値の正体：第3回】p値を超えて：効果量と信頼区間で見る本当の臨床的価値

1. 統計的有意性と臨床的重要性の違い

2. 血圧1mmHg低下は意味がある？

3. 原則の解説

【原則5】p値は効果の大きさや重要性を示すものではない

【原則6】p値単独では十分な証拠とならない

4.【実践：p値を超えた評価方法】

5. まとめ

参考文献

コメントするコメントをキャンセル

★【p値の正体：第3回】p値を超えて：効果量と信頼区間で見る本当の臨床的価値

1. 統計的有意性と臨床的重要性の違い

2. 血圧1mmHg低下は意味がある？

3. 原則の解説

【原則5】p値は効果の大きさや重要性を示すものではない

【原則6】p値単独では十分な証拠とならない

4.【実践：p値を超えた評価方法】

5. まとめ

参考文献

コメントする コメントをキャンセル

コメントするコメントをキャンセル