κ統計量は「カッパとうけいりょう」と読みます。
「え?何かお呼びですか?」と河童が出てくるかもしれませんが、今回は関係ありません。
κ統計量とは、ある現象を2人の観察者が(あるいは同じ観察者が2回)観察したときに、その結果がどの程度一致しているかをあらわす値です。値は0〜1までの値をとり、1に近いほど一致しています。
どういうことでしょうか?
例を用いて考えてみましょう。
2人の先生が、同じ100人の生徒を3段階評価しました。
濃い青色のセルは、2人の先生が同じ評価をした生徒の数です。薄い水色のセルは2人の先生が違った評価をした生徒の数です。
2人の先生の評価が一致している割合Poを求めるとPo=(52+18+7)/100=0.77です。
次に、2人の先生の評価が偶然一致する確率Peを求めます。
例えば、A先生が「優」と診断する確率は64/100=0.64です。B先生の場合は、55/100=0.55です。そうすると全く偶然で一致する確率は両者をかけあわせて、0.64×0.55となります。
それを「優」「良」「可」それぞれ足し合わせると、
Pe=(0.64×0.55)+(0.25×0.3)+(0.11×0.15)=0.4435となります。
κ統計量は、偶然によらず2人の評価が一致する割合ですので以下のように定義されます。
κ=(Po-Pe)/(1-Pe)
今回の例だとκ=(Po-Pe)/(1-Pe)=(0.77-0.4435)/(1-0.4435)=0.586…となります。
κ係数は以下のように考えられますので、今回の例はそこそこ一致しているなということになります。
0.4〜0.6:中等度の一致
0.6〜0.8:かなりの一致
0.8〜1.0:ほぼ完璧の一致
まとめ:
κ統計量は、評価や観察の一致の度合いを評価する統計量です。
異なる人の評価を比べる場合でも、同じ人の複数回行った評価を比べる場合でも使うことができます。
文献:
Cohen J. et al. A Coefficient of Agreement for Nominal Scales. Educ Psychol Meas. 1960; 20(1): 37.
doi: 10.1177/001316446002000104
2件のピンバック
★研修医の燃え尽き症候群を予防するには? | 耳鼻咽喉科医の独り言
★嚥下障害を早期に見つけ出す | 耳鼻咽喉科医の独り言