統計の基礎〜クロス集計2 活用方法 

AI

クロス集計を行って、その内容を確認します。
次の例ではA商品とB商品の評価をクロス集計したものです。

原因と結果に何らかの関係が認められる場合、因果関係があるといいます。
因果関係にあるようなクロス集計表は原因になるものを列として、結果を行にします。
統計では原因側の変数を説明変数と呼び、結果側の変数を応答変数と呼びます。

原因と結果が必ずしも因果関係があるとは限りません。つまり、原因と結果がはっきりとしてない場合もあります。
このような場合は連関関係にあるといいます。

因果関係にある場合は行パーセントに意味がありますが、連関関係の場合には行パーセント、列パーセントどちらでも解釈が成り立ちます。

スポンサーリンク

オッズ比

オッズ比は、ある事象の起こりやすさを2つの群で比較して示す比率です。

オッズ比は2×2のクロス表で用いられます。

満足 不満足
A商品 a b
B商品 c d

$$
オッズ比 = \frac{a \times d}{b \times c}
$$

A商品はB商品よりもオッズ比倍の満足していると説明できます。

例えば次のような場合

満足 不満足
A商品 10 5
B商品 7 8

$$
\frac{10 \times 8}{5 \times 7} = 2.2857
$$

A商品はB商品よりも2.2857倍満足していると言えます。

ファイ係数

ファイ係数は2変数の関係が連関関係の強さを表す指標です。

連関とは:2つの属性間に相互関係が存在することを表す統計用語です。
クロス集計表における行要素と列要素の2つの属性が独立でないとき、それら2つの属性は「連関を持つ」、または「連関がある」と言います。
簡単に言えば関連があるということです。

肺がんあり 肺がんなし
喫煙 a b n1
非喫煙 c d n2
m1 dm2 mn

ファイ係数は次の式で求まります。

$$
\phi = \frac{a \times d – b \times c}{\sqrt {m_1 \times m_2 \times n_1 \times n_2}}
$$
ファイ係数の値と連関関係の有無の目安は次のようになります。

ファイ係数 目安 備考
0.8以上 非常に強い 連関関係あり
0.8〜0.5 やや強い 連関関係あり
0.5〜0.25 やや弱い 連関関係あり
0.25以下 非常に弱い 連関関係ない
スポンサーリンク

お勧め書籍

AI関連

Python

JavaScript

HTML CSS関連

統計学

AI lecture
スポンサーリンク
dororoをフォローする
IT工房|AI入門とWeb開発
タイトルとURLをコピーしました