1. まだあるp値への誤解
前回は、p値が「仮説とデータのズレ」を示す指標であり、「仮説が正しい確率」ではないことを学びました。
しかし、p値の誤用はそれだけではありません。今回は、米国統計学会(ASA)の6原則のうち、原則3と原則4を通じて、「p<0.05」という閾値への過度な依存の危険性と、研究の透明性の重要性について解説します。
特に臨床現場で重要な「統計的有意差と臨床的意義の違い」について、身近な例を交えながら見ていきましょう。医療の質を高めるために、これらの原則を理解することは不可欠です。
2. p=0.049とp=0.051とはそんなに違うのか?
医学研究の世界では、長年「p<0.05」が統計的有意性の基準として使われてきました。
しかし、この0.05という数字に科学的な根拠があるわけではありません。
実は、1920年代に統計学者のロナルド・フィッシャーが便宜的に設定した値が、いつの間にか絶対的な基準として定着してしまったのです。

問題は、p=0.049とp=0.051の間に本質的な違いはないにもかかわらず、前者は「有意な発見」として論文に掲載され、後者は「効果なし」として葬り去られることです。血糖値が100mg/dLか101mg/dLかで糖尿病の診断が極端に変わらないのと同じように、p値も連続的な指標として捉えるべきなのです。
さらに深刻なのは、研究者が「有意な結果」を得るために、データ分析を恣意的に操作する「pハッキング」と呼ばれる行為です。複数の解析を試して、都合の良い結果だけを報告する──このような行為は、医学の信頼性を根底から揺るがしかねません。
ASAはこのような「p<0.05至上主義」からの脱却を強く訴えています。
3. 原則の解説
【原則3】p値だけで科学的結論を下してはいけない
統計的有意差の有無は、白黒つける絶対的な基準ではありません。一回の試験でたまたまp<0.05になったからといって、「効果あり」と即断してはいけないのです。
例えば、ある鎮痛薬の臨床試験でp=0.03という結果が得られたとしましょう。しかし、これだけで「この薬は効く」と結論づけるのは早計です。なぜなら、研究デザインの質(無作為化は適切か?盲検化されているか?)、測定の信頼性、他の研究との整合性、生物学的な妥当性など、考慮すべき要素がたくさんあるからです。
逆に、p>0.05だったからといって「効果はない」と決めつけるのも問題です。検出力不足で見逃された可能性や、臨床的に意味のある差が潜んでいる可能性もあります。
ASAは「p値だけで発見を宣言したり、政策を決定したりすべきではない」と強調しています。医療現場では、統計的有意差だけでなく、患者さんにとっての実際の利益(臨床的意義)を常に考える必要があります。
【原則4】すべての分析結果を透明に報告する
統計解析では、都合の良い結果だけを選んで報告すると、誤った結論につながります。例えば、10通りの解析を行って、その中の1つだけp<0.05になった場合、それだけを報告すれば一見「有意な発見」に見えてしまいます。しかし、これは偶然の産物を「発見」に仕立て上げる行為です。
実際の例として、ある新薬の嘔吐予防効果を「術後24時間」「48時間」「72時間」など複数の時点で評価し、たまたま有意になった時点だけを報告するようなケースがあります。このような「選択的報告」や「データあさり」は、科学的不正行為とみなされます。

ASAは、複数の解析を行った場合はそのすべてと、結果選択の過程を明らかにしなければならないと述べています。たとえネガティブな結果でも、それは重要な情報です。研究の透明性を高めることで、より信頼性の高い医学的エビデンスを構築できるのです。
すべての結果を正直に報告する──これが科学の基本姿勢なのです。
4. まとめ
今回は、p値の閾値だけで判断することの危険性と、研究の透明性の重要性について学びました。
p=0.05という境界線に囚われず、研究全体の質と文脈を考慮することが大切です。統計的に有意でも臨床的に意味がない場合もあれば、有意でなくても重要な知見が隠れている可能性もあります。
次回は最終回として、「効果の大きさ」と「p値の限界」について、実際の医療現場での活用方法とともに解説します。
参考文献
- Wasserstein RL, et al. The ASA Statement on p-Values: Context, Process, and Purpose. The American Statistician. 2016;70(2):129-133.
DOI: 10.1080/00031305.2016.1154108 - Greenland S, et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol. 2016;31(4):337-350.
DOI: 10.1007/s10654-016-0149-3






