はじめに
Excelには様々な統計関数が用意されていますが、CHISQ.DIST関数は、カイ二乗分布に基づいて確率を計算する際に役立ちます。カイ二乗分布は、適合度検定、独立性検定、分散分析など、統計学において非常に重要な役割を果たします。この記事では、CHISQ.DIST関数の基本的な使い方から、画像にある例、そしてExcelのバージョン情報までを詳しく解説します。
カイ二乗分布とは?
カイ二乗分布は、k個の独立な標準正規分布に従う確率変数の二乗和が従う分布です。このkを自由度と呼びます。カイ二乗分布は、常に正の値を取り、非対称な分布です。自由度が大きくなるにつれて、正規分布に近づいていきます。
CHISQ.DIST関数とは?
CHISQ.DIST関数は、カイ二乗分布における累積分布関数(CDF)または確率密度関数(PDF)の値を返します。累積分布関数とは、「ある値x以下の確率」を表す関数です。
基本的な構文
Excel
=CHISQ.DIST(x, 自由度, 関数形式)
各引数の意味は以下の通りです。
- x(必須): カイ二乗分布における値を指定します(統計量)。
- 自由度(必須): 分布の自由度を指定します。正の整数である必要があります。
- 関数形式(必須):
- TRUE:累積分布関数(指定された値以下の確率)
- FALSE:確率密度関数(指定された値の確率密度)
Excelバージョン情報:CHISQ.DIST
CHISQ.DIST関数は、Excel 2010で導入されました。それ以前のバージョンでは、CHIDIST関数が使用されていました。CHIDIST関数は互換性のために残されていますが、新しいバージョンではCHISQ.DISTを使用することを推奨します。また、Excel 2010以降では、右側確率を求めるCHISQ.DIST.RT
関数も追加されています。従来のCHIDIST
関数は右側確率を求める関数でした。
画像例の解説
画像では、以下の設定でCHISQ.DIST関数を使用しています。
- 統計量 (x): セルB1に1.50が入力されています。
- 自由度: 5が指定されています。
- 関数形式: TRUEが指定されています。
- 数式: セルB2には以下の数式が入力されています。
Excel
=CHISQ.DIST(B1,5,TRUE)
この数式を分解して解説します。
- B1: 統計量(1.50)を指定しています。
- 5: 自由度を指定しています。
- TRUE: 累積分布関数を使用することを指定しています。つまり、1.50以下の確率を計算します。
数式の動作
この数式は、「自由度が5のカイ二乗分布において、統計量が1.50以下の確率」を計算します。結果として、セルB2には0.0916…(約0.09)と表示されています。これは、統計量が1.50以下の値を取る確率が約9%であることを意味します。
Excelサンプルデータのダウンロード
上記画像のエクセルサンプルデータを、以下のリンクからダウンロードし、練習用として活用ください。
【Excel】練習用サンプルデータ(例題)をダウンロード(無料)
CHISQ.DIST.RT関数(右側確率)
カイ二乗分布において、ある値より大きい確率(右側確率)を求めたい場合は、CHISQ.DIST.RT関数を使用するか、CHISQ.DIST関数と1を使って計算できます。
=CHISQ.DIST.RT(x, 自由度)
=1-CHISQ.DIST(x, 自由度, TRUE)
CHIDIST関数(古いバージョン)
Excel 2007以前のバージョンでは、CHIDIST関数を使ってカイ二乗分布の右側確率を計算していました。
=CHIDIST(x, 自由度)
これは、=CHISQ.DIST.RT(x, 自由度)
と同じ結果を返します。
例:適合度検定
例えば、あるサイコロを60回振った結果、各目の出た回数が以下のようになったとします。
目 | 出た回数 |
---|---|
1 | 8 |
2 | 12 |
3 | 9 |
4 | 11 |
5 | 10 |
6 | 10 |
このサイコロが偏りなく作られているかを検定する場合、カイ二乗検定を行います。期待値は各目10回なので、カイ二乗統計量は以下のように計算できます。
=SUM((各目の出た回数-10)^2/10)
この統計量を使って、CHISQ.DIST.RT関数でp値を求めることができます。
CHISQ.DIST関数の注意点
- xと自由度は数値でなければなりません。
- 自由度は正の整数でなければなりません。
- xが負の値の場合、エラー値 #NUM! が返されます。
- 自由度が0以下の場合、エラー値 #NUM! が返されます。
まとめ
CHISQ.DIST関数は、カイ二乗分布における確率を計算する際に非常に役立つ関数です。統計検定などで頻繁に使用されます。最新のExcelを使用している場合は、CHISQ.DIST関数とCHISQ.DIST.RT関数を使用し、古いバージョンを使用している場合はCHIDIST関数を使用することを覚えておきましょう。
この解説で、CHISQ.DIST関数について、より深く理解できたかと思います。この情報を活用し、Excelでのデータ分析をより効率的に行いましょう。
コメント