仮平均を用いた平均と分散の計算
ちょっとしたメモ. 多分, 教科書には載っているだろうけど忘れがちなので. 以下, 平均は標本平均, 分散は標本分散(不偏分散ではない)を指す.
標本値を眺めていて, 大よその平均値が推定できる場合, 標本の平均や分散は仮平均を用いて計算したほうが手計算では便利なようだ. コンピュータで計算するときも, 桁落ちが発生しないように仮平均を用いた計算をしている場合がある.
以下, 標本の大きさを n, 標本値を Xi (i=1, …, n), 平均を m, 分散を s2, 仮平均を a とする. また, Yi=Xi–a とし, Y の平均と分散をそれぞれ mt, st2 とする. すると, 次の関係を得る.
- m=mt+a
- s2=st2
この式は E(aX+b)=aE(X)+b, V(aX+b)=a2V(X) の応用だが, こうした工夫をすることで計算が楽になる.
手計算における計算の工夫に s2=Σ[i=1, n]Xi2/n – m2 というものもよく知られているが, この計算を実行する前に, 標本値から仮平均を引いて定数倍をするという前処理をすることで, さらに計算が容易になる.
以下は, ある 10 人の握力と, これらの値から仮平均 40 を引いたものを処理した例 (単位は kg).
No. | 握力 | 握力-40 |
---|---|---|
平均値 | m | -0.5 |
分散 | s2 | 26.25 |
1 | 34 | -6 |
2 | 31 | -9 |
3 | 44 | +4 |
4 | 38 | -2 |
5 | 45 | +5 |
6 | 47 | +7 |
7 | 33 | -7 |
8 | 41 | +1 |
9 | 40 | 0 |
10 | 42 | +2 |
表中の m や s2 は, 仮平均を引いた値の平均や分散から容易に算出できる. m=-0.5+40=39.5, s2=26.25 となる. 分散を算出するために, 元の標本値を直接使うよりも仮平均を引いた値を用いた方が計算しやすいということは実際に手計算してみればよく分かるだろう.