二項分布とF分布の関係

統計学ではよく使う話だけど、入門書には載ってないことがあるのでメモ

二項分布Bn, p(r) (確率質量関数 binom(n,r)pr (1-p)n-r ) と F 分布 Gn1,n2(x) (確率密度関数 (n1x/(n1x+n2))n1/2 (1-n1x/(n1x+n2))n2/2/(x Β(n1/2,n2/2) ) ) には次の関係がある.

Σ[k=0, r]Bn, p(k)=∫[x=x0,∞]Gn1,n2(x)dx (ただし、 n1=2(r+1), n2=2(n-r), x0=n2p/(n1(1-p)) )

Σ[k=r+1, n]Bn, p(k)=∫[x=x1,∞]Gn1,n2(x)dx (ただし、 n1=2(n-r), n2=2(r+1), x1=n2(1-p)/(n1p) )

これは, ∫[y=p,1]yr (1-y)n-r-1 dy について, y の指数が 0 になるまでひたすら部分積分を繰り返していくと Σ[k=0,r]Bn,p(k)=(n!/(r!(n-r-1)!))∫[y=p,1] yr (1-y)n-r-1 dy を得るから、これを適切に置換積分することで得られる.

二項分布の累積分布関数をコンピュータで計算させるには面倒な部分がある. それは, 二項分布における試行数 n が大きくなるにつれ, 途中で階乗を計算する必要があるため中間値に大きな値が増え, 精度を落とす場面が増える (多倍長整数を用いて計算すれば精度の問題は解決できるが計算速度は落ちる). 累積分布関数を計算するには階乗を何度も計算する必要が出てくるので定義どおりの計算を実装することはお勧めできない. 積分の数値計算も面倒そうに見えるが, これについては n1x/n2 =tan2θ と置換積分することで数値積分しやすい形にできる.

コメントを残す