はじめに
Excelには様々な統計関数が用意されていますが、CHISQ.TEST関数(および以前のCHITEST関数)は、カイ二乗検定を行い、実測値と期待値の適合度を評価する際に役立ちます。カイ二乗検定は、カテゴリカルデータ(分類されたデータ)の分析で広く使用され、例えば、アンケート調査の結果が予想と一致するかどうか、商品の売れ行きが地域によって差があるかどうかなどを検証するのに役立ちます。この記事では、CHISQ.TEST関数の基本的な使い方から、画像にある例、そしてExcelのバージョン情報までを詳しく解説します。
カイ二乗検定とは?
カイ二乗検定は、実測値と期待値の間に有意な差があるかどうかを検定する統計手法です。具体的には、実測値と期待値の差の二乗を期待値で割った値を合計したカイ二乗統計量を計算し、この統計量に基づいてp値を求めます。p値は、実測値と期待値の差が偶然によって生じる確率を表し、p値が小さいほど、実測値と期待値の間に有意な差があると判断されます。
CHISQ.TEST関数とは?
CHISQ.TEST関数は、カイ二乗検定を行い、指定された実測値と期待値の間に偶然によって生じる確率(p値)を返します。
基本的な構文
Excel
=CHISQ.TEST(実測値範囲, 期待値範囲)
各引数の意味は以下の通りです。
- 実測値範囲(必須): 実測値を含むセルの範囲を指定します。
- 期待値範囲(必須): 期待値を含むセルの範囲を指定します。
CHITEST関数とは?
CHITEST関数は、Excelの古いバージョンで使用されていた関数で、CHISQ.TEST関数と全く同じ結果を返します。
Excelバージョン情報:CHISQ.TESTとCHITEST
- CHISQ.TEST: Excel 2010で導入されました。
- CHITEST: Excelの古いバージョン(Excel 2007以前など)で使用されていた関数で、互換性のために残されています。
最新のExcelを使用している場合は、CHISQ.TEST
関数を使用することを推奨します。
画像例の解説
画像では、以下の設定でCHISQ.TEST関数を使用しています。
- 実測値範囲: B2:B6
- 期待値範囲: C2:C6
- 数式: セルC7には以下の数式が入力されています。
Excel
=CHISQ.TEST(B2:B6,C2:C6)
この数式を分解して解説します。
- B2:B6: 回数0から4までの実測値を指定しています。
- C2:C6: 回数0から4までの期待値を指定しています。
数式の動作
この数式は、実測値と期待値の差が偶然によって生じる確率を計算します。結果として、セルC7には0.122…(約0.12)と表示されています。これは、実測値と期待値の差が偶然の変動範囲内である確率が約12%であることを意味します。一般的に、p値が0.05(5%)以下の場合、実測値と期待値の間に有意な差があると判断されます。この例では、p値が0.12と0.05より大きいため、実測値と期待値の差は偶然の変動範囲内であると判断されます。
Excelサンプルデータのダウンロード
上記画像のエクセルサンプルデータを、以下のリンクからダウンロードし、練習用として活用ください。
【Excel】練習用サンプルデータ(例題)をダウンロード(無料)
例:サイコロの偏りの検定
例えば、あるサイコロを60回振った結果、各目の出た回数が以下のようになったとします。
目 | 実測値 | 期待値(各目10回) |
---|---|---|
1 | 8 | 10 |
2 | 12 | 10 |
3 | 9 | 10 |
4 | 11 | 10 |
5 | 10 | 10 |
6 | 10 | 10 |
このサイコロが偏りなく作られているかを検定する場合、CHISQ.TEST関数を使用します。実測値の範囲をB2:B7、期待値の範囲をC2:C7とすると、
=CHISQ.TEST(B2:B7,C2:C7)
でp値を計算できます。
CHISQ.TEST/CHITEST関数の注意点
- 実測値範囲と期待値範囲は同じ大きさの範囲でなければなりません。
- 範囲に数値以外の値が含まれている場合、エラー値 #N/A が返されます。
- 期待値に0が含まれている場合、エラー値 #DIV/0! が返されます。
まとめ
CHISQ.TEST関数とCHITEST関数は、カイ二乗検定を行い、実測値と期待値の適合度を評価する際に非常に役立つ関数です。カテゴリカルデータの分析などで頻繁に使用されます。最新のExcelを使用している場合は、CHISQ.TEST関数を使用し、古いバージョンを使用している場合はCHITEST関数を使用することを覚えておきましょう。
この解説で、CHISQ.TEST/CHITEST関数について、より深く理解できたかと思います。この情報を活用し、Excelでのデータ分析をより効率的に行いましょう。
コメント