統計教育; 統計の授業における学生からの質問(Q1) (富澤貞男)東京理科大学

 (標本平均の平均(期待値)は,なぜ母平均に一致するか)


 学生から「統計学は参考書等を見てもよくわからないところがいくつもある」ので教えてほしいとよく言われます.そのうちの一つに次のような質問 (Q) を学生からしばしば受けます.もちろん,統計学を良くご存じの先生方は (A) のような説明をしなくても明らかであると仰るかと思いますが,意外に学生は混乱しているようです.以下は特に学生の皆さんに参考にしていただければ幸いです.

Q1
 推測統計学において,標本平均の平均(期待値)は,なぜ母平均に一致するのですか?

A1
 たとえば,日本人20歳の男性全体(約60万人程度でしょうか)の集団(母集団)を考えましょう.今,身長に関心があるとします.60万人のヒトの各身長の値は正確には皆違います.60万人のヒトの身長は平均(母平均という)μ(ミュー),分散(母分散という)σ^2(シグマの2乗)の分布(一般に正規分布)に従います.ここに母平均と母分散の値は,残念ながら我々人間には厳密にはわからないです(未知です).60万人全員の身長を測定することもできません.

 そこで,日本中に調査しに出かけて,n人(たとえば,100人)の身長を測定することにします.つまり標本(母集団(20歳の男性全体)の一部分)を調べることにします.たとえば,札幌で任意の20歳の男性一人を選んでそのヒトの身長を(大文字で) X1 (cm) とします.つぎに,たとえば,仙台で同様に一人のヒトの身長を(大文字で) X2,...,沖縄で調べるときの身長を(大文字で) Xn とします.このとき,未知の母平均 μ の推定を標本平均 (X1+X2+....+Xn)/n( Y と記すことにします(通常は Xバー で書きますが,ここでは Y とします))で推定します.(ここに,X1, X2, ..., Xn は確率変数で大文字で通常書きます.この時点ではまだ調査してないので,X1, X2, ..., Xn の値は具体的にはまだわかりません).


(標本調査を行う前に)

 我々は,日本中に標本調査に出かける前に(行う前に),未知の母平均 μ を標本平均 Y で推定したら,Y の値はいくらになると期待できるか(予想できるか)を考えたくなります.Y の平均(期待値(Expectation))は,E(Y) = (E(X1)+E(X2)+...+E(Xn))/n で求まります.ここに,札幌へ行って任意の20歳の男性一人の身長を調べると値はいくつになると期待できるかというと,その人は60万人の中の一人で同じ母集団分布(母平均μ,母分散σ^2)に従いますので,(なお,まだ値を測定してない段階ですので, X1 の値はいくらになるかはまだわからず) X1 は μ (期待値である母平均)になると期待できます.つまり, E(X1) は μ に等しいです.同様に,仙台でも X2 は μ になると期待できます.つまり, E(X2) も μ に等しいです.以下すべて同様で,結局,標本平均の平均 E(Y) は未知の母平均 μ に一致します.つまり,標本平均 Y は,我々の知りたかった60万人のヒトの身長の未知の母平均 μ に一致すると期待できます.すなわち,Y は平均的には μ に一致するという結果が得られます.

 なお,詳細は略しますが,標本平均 Y が母平均 μ からどれくらいずれていると期待できるか(予想できるか)を示す標本平均 Y の分散は σ^2/n (= E((Y-μ)^2))となります.したがって,標本数 n をある程度多く取れば,標本平均 Y の分散は小さくなりますので,標本平均 Y は未知の母平均 μ にほぼ一致するといえます(ある程度の誤差はありますが).


(標本調査を行った後で)

 しばしば学生がわからなくなる点は,札幌で調べた身長の値(標本値)を小文字で x1 (cm)(たとえば,171.2cm),仙台で調べた身長の値(標本値)を小文字で x2 (cm)(たとえば,167.6cm),...,沖縄で調べた身長の値を小文字で xn (cm)(たとえば,173.5cm)として (たとえば,標本数 n=100 として),標本平均値(標本平均の値)は,たとえば,(小文字で)y = (x1+x2+...+xn)/n = (171.2+167.6+...+173.5)/100 = 172.2 cm となるので,E(x1) = 171.2, E(x2) = 167.6, ..., E(xn)= 173.5 となり,よって,E(y) = 172.2 となって,このことから標本平均の平均は未知の母平均 μ に一致しないのではという質問が多いです. 


 この学生は標本平均(大文字の Y )と標本平均値(小文字の y )を同じものと思っているので,定数である標本平均値(小文字の y )の平均は(定数は平均を考えても同じ定数のままであり)母平均 μ に一致はしないので混乱しているようです.何に対しての平均(期待値)を考えるかが重要です.つまり,標本調査を行う前の段階(標本の値を知る前の段階)での平均(期待値)を考えると,標本平均 Y の平均(期待値)は,未知の母平均 μ に一致します.ここでは,大文字で書いた確率変数の標本平均 Y とその具体的な数値である小文字で書いた標本平均値 y では区別しており,意味が違いますので,何の平均を考えるのかに注意しましょう.


(参考文献)
国沢清典 編(2021年): 「確率統計演習2 統計」 (培風館)
小林正弘・田畑耕治 著(2021年): 「確率と統計; 一から学ぶ数理統計学」 (共立出版)


(補足)

(1) 質問 Q2 「最尤推定量の意味は何か(定義や求め方でなく)?」については  こちら からご覧下さい.

(2) 質問 Q4 「母分散の意味は何か?」については  こちら 

(3) 質問 Q5 「仮説検定とは何か?」については  こちら 

(4) 質問 Q6 「区間推定(信頼区間)とは何か?」については  こちら 

(5) 質問 Q7 「回帰モデルにおける偏回帰係数とは何か?」については  こちら 

(6) 質問 Q9 「スピアマンの順位相関係数とは何か?(特に,分割表において)」については  こちら 

(7) 質問 Q0 「有意水準・仮説検定・平均と分散」の日常生活と結びつけた「説明」は こちらの  スライド

(8) 質問 Q11 「母共分散の意味は何か」については  こちら

(9) 質問 Q13 「クラメール連関係数の最大値とその導出」については  こちら

戻る