クロス集計を行って、その内容を確認します。
次の例ではA商品とB商品の評価をクロス集計したものです。
原因と結果に何らかの関係が認められる場合、因果関係があるといいます。
因果関係にあるようなクロス集計表は原因になるものを列として、結果を行にします。
統計では原因側の変数を説明変数と呼び、結果側の変数を応答変数と呼びます。
原因と結果が必ずしも因果関係があるとは限りません。つまり、原因と結果がはっきりとしてない場合もあります。
このような場合は連関関係にあるといいます。
因果関係にある場合は行パーセントに意味がありますが、連関関係の場合には行パーセント、列パーセントどちらでも解釈が成り立ちます。
オッズ比
オッズ比は、ある事象の起こりやすさを2つの群で比較して示す比率です。
オッズ比は2×2のクロス表で用いられます。
満足 | 不満足 | |
---|---|---|
A商品 | a | b |
B商品 | c | d |
$$
オッズ比 = \frac{a \times d}{b \times c}
$$
A商品はB商品よりもオッズ比倍の満足していると説明できます。
例えば次のような場合
満足 | 不満足 | |
---|---|---|
A商品 | 10 | 5 |
B商品 | 7 | 8 |
$$
\frac{10 \times 8}{5 \times 7} = 2.2857
$$
A商品はB商品よりも2.2857倍満足していると言えます。
ファイ係数
ファイ係数は2変数の関係が連関関係の強さを表す指標です。
連関とは:2つの属性間に相互関係が存在することを表す統計用語です。
クロス集計表における行要素と列要素の2つの属性が独立でないとき、それら2つの属性は「連関を持つ」、または「連関がある」と言います。
簡単に言えば関連があるということです。
肺がんあり | 肺がんなし | 計 | |
---|---|---|---|
喫煙 | a | b | n1 |
非喫煙 | c | d | n2 |
計 | m1 | dm2 | mn |
ファイ係数は次の式で求まります。
$$
\phi = \frac{a \times d – b \times c}{\sqrt {m_1 \times m_2 \times n_1 \times n_2}}
$$
ファイ係数の値と連関関係の有無の目安は次のようになります。
ファイ係数 | 目安 | 備考 |
---|---|---|
0.8以上 | 非常に強い | 連関関係あり |
0.8〜0.5 | やや強い | 連関関係あり |
0.5〜0.25 | やや弱い | 連関関係あり |
0.25以下 | 非常に弱い | 連関関係ない |
コメントを投稿するにはログインしてください。