はじめに
Excelには様々な統計関数が用意されていますが、HYPGEOM.DIST関数は、超幾何分布に基づいて確率を計算する際に役立ちます。特に、母集団から一部を抽出する際に、特定の条件を満たす要素が含まれる確率を求める場合に有効です。品質管理における不良品率の計算などに活用できます。
超幾何分布とは?
超幾何分布は、有限の母集団から非復元抽出(一度取り出したものを元に戻さない抽出)を行う場合に、特定の属性を持つ要素が抽出される確率を表す確率分布です。例えば、箱の中に赤玉と白玉が入っていて、そこからいくつか玉を取り出すときに、取り出した玉の中に何個赤玉が含まれる確率を計算する場合などに使用されます。
HYPGEOM.DIST関数とは?
HYPGEOM.DIST関数は、超幾何分布に基づいて確率を計算します。以前のバージョンではHYPGEOMDISTという名前でしたが、現在はHYPGEOM.DISTが推奨されています。
基本的な構文
Excel
=HYPGEOM.DIST(標本の成功数, 標本数, 母集団の成功数, 母集団の大きさ, 関数形式)
各引数の意味は以下の通りです。
- 標本の成功数(必須): 抽出する標本の中で、目的の属性(例:不良品)を持つ要素の数を指定します。
- 標本数(必須): 母集団から抽出する標本の数を指定します。
- 母集団の成功数(必須): 母集団全体の中で、目的の属性を持つ要素の数を指定します。
- 母集団の大きさ(必須): 母集団全体の要素の数を指定します。
- 関数形式(必須): 計算に使用する関数の形式を論理値で指定します。
- TRUE:累積分布関数(指定された数以下の成功数となる確率)
- FALSE:確率質量関数(指定された数の成功数となる確率)
画像例の解説
画像では、以下の設定でHYPGEOMDIST関数(ここではHYPGEOM.DISTとして解説)を使用しています。
- 不良品の数(標本の成功数): セルA4に2が入力されています。
- 抽出する個数(標本数): セルB4に10が入力されています。
- 全体の不良品の数(母集団の成功数): セルB4に10が入力されています。(これは少し特殊な例です。母集団に含まれる不良品の数と抽出する個数が同じになっています。)
- 全体の個数(母集団の大きさ): セルC4に10,000が入力されています。
- 数式: セルC5には以下の数式が入力されています。
Excel
=HYPGEOM.DIST(A4,B4,B4,C4,FALSE)
この数式を分解して解説します。
- A4: 標本の成功数(2)を指定しています。つまり、抽出した10個の中に2個の不良品が含まれる確率を求めます。
- B4: 標本数(10)を指定しています。つまり、母集団から10個抽出します。
- B4: 母集団の成功数(10)を指定しています。つまり、母集団全体に10個の不良品が含まれています。
- C4: 母集団の大きさ(10,000)を指定しています。つまり、全体で10,000個の製品があります。
- FALSE: 確率質量関数を使用することを指定しています。つまり、ちょうど2個の不良品が含まれる確率を計算します。
数式の動作
この数式は、「10,000個の製品の中に10個の不良品が含まれている状態で、そこから10個抽出したときに、ちょうど2個の不良品が含まれる確率」を計算します。結果として、セルC5には0.00004025(0.004025%)と表示されています。
Excelサンプルデータのダウンロード
上記画像のエクセルサンプルデータを以下のリンクからダウンロードしてください。
【Excel】練習用サンプルデータ(例題)をダウンロード(無料)
例:くじ引き
この例をくじ引きに例えて考えてみましょう。
- 10,000本のくじの中に当たりくじが10本あります。
- そこから10本引いたときに、ちょうど2本当たる確率を計算しています。
関数形式の使い分け
- TRUE(累積分布関数): 例えば、
=HYPGEOM.DIST(2, 10, 10, 10000, TRUE)
は、「10本引いたときに、当たりくじが2本以下(0本、1本、2本)である確率」を計算します。 - FALSE(確率質量関数): 例えば、
=HYPGEOM.DIST(2, 10, 10, 10000, FALSE)
は、「10本引いたときに、ちょうど2本当たる確率」を計算します。
HYPGEOM.DIST関数の注意点
- 引数はすべて整数でなければなりません。小数部分があると切り捨てられます。
- 引数に数値以外の値を指定すると、エラー値 #VALUE! が返されます。
- 引数の値が適切でない場合(例えば、標本の成功数が標本数より大きい場合など)、エラー値 #NUM! が返されます。
古い関数HYPGEOMDISTについて
以前のバージョンのExcelでは、HYPGEOMDIST
という関数が使用されていましたが、これは互換性のために残されているだけで、最新のExcelではHYPGEOM.DIST
を使用することが推奨されています。HYPGEOMDIST
には「関数形式」の引数がありません。常に確率質量関数として動作します。
まとめ
HYPGEOM.DIST関数は、有限母集団からの非復元抽出における確率計算に非常に役立つ関数です。品質管理における不良品率の計算や、くじ引きなどの確率計算など、様々な場面で活用できます。この関数を理解し、適切に活用することで、データ分析の幅を広げることができるでしょう。
この解説で、HYPGEOM.DIST関数について、より深く理解できたかと思います。この情報を活用し、Excelでのデータ分析をより効率的に行いましょう。
コメント