★で始まるブログは一部医療従事者向けの内容を含みます。詳しくは「このサイトについて」をごらんください。

★κ統計量とは

 κ統計量は「カッパとうけいりょう」と読みます。
「え?何かお呼びですか?」と河童が出てくるかもしれませんが、今回は関係ありません。
  

 κ統計量とは、ある現象を2人の観察者が(あるいは同じ観察者が2回)観察したときに、その結果がどの程度一致しているかをあらわす値です。値は0〜1までの値をとり、1に近いほど一致しています。

 どういうことでしょうか?

 例を用いて考えてみましょう。
 2人の先生が、同じ100人の生徒を3段階評価しました。
  

 濃い青色のセルは、2人の先生が同じ評価をした生徒の数です。薄い水色のセルは2人の先生が違った評価をした生徒の数です。

 2人の先生の評価が一致している割合Poを求めるとPo=(52+18+7)/100=0.77です。

 次に、2人の先生の評価が偶然一致する確率Peを求めます。
 例えば、A先生が「優」と診断する確率は64/100=0.64です。B先生の場合は、55/100=0.55です。そうすると全く偶然で一致する確率は両者をかけあわせて、0.64×0.55となります。
 それを「優」「良」「可」それぞれ足し合わせると、
Pe=(0.64×0.55)+(0.25×0.3)+(0.11×0.15)=0.4435となります。

 κ統計量は、偶然によらず2人の評価が一致する割合ですので以下のように定義されます。

κ=(Po-Pe)/(1-Pe)

 今回の例だとκ=(Po-Pe)/(1-Pe)=(0.77-0.4435)/(1-0.4435)=0.586…となります。

 κ係数は以下のように考えられますので、今回の例はそこそこ一致しているなということになります。

  0.4〜0.6:中等度の一致
  0.6〜0.8:かなりの一致
  0.8〜1.0:ほぼ完璧の一致

まとめ:

 κ統計量は、評価や観察の一致の度合いを評価する統計量です。
 異なる人の評価を比べる場合でも、同じ人の複数回行った評価を比べる場合でも使うことができます。

文献:

Cohen J. et al. A Coefficient of Agreement for Nominal Scales. Educ Psychol Meas. 1960; 20(1): 37.
doi: 10.1177/001316446002000104

2件のピンバック

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です