(最尤推定量の 意味 は何か(定義や求め方でなく))
学生から統計学に関して次のような質問をしばしば受けます:「最尤推定量の意味がよくわからない; 特に連続型分布の場合に,この推定量の「意味」は何ですか(定義や求め方でなく)?」. 以下に具体例で説明したいと思います.学生の皆さんに少しでも参考になれば幸いです.
Q2
最尤推定量の 意味 は何ですか(定義や求め方でなく)?
A2
最尤(さいゆう)推定量の定義や求め方等の詳細は多くの書籍等に記載されていますのでそちらをご覧いただければ幸いです(たとえば,下記文献を参照). ここでは,具体例で,最尤推定値の「意味」をわかりやすく説明したいと思います.
ある島に住んでいる20歳の男性全体(たとえば,約1万人)の集団(母集団)を考えましょう.この1万人の男性全体からの任意のひとりを選んだときの身長を \(X\) (cm) とすると,\(X\) は母平均 \(\mu\),母分散 \(\sigma^2\) の正規分布 \(N(\mu, \sigma^2)\) に従うとします.ここに母平均 \(\mu\) と母分散 \(\sigma^2\) は未知です.この島で実際に5人だけ身長を測ることができました.それらの値(標本値)は,171.2,166.4,174.3,168.2,172.4 (cm) でした.これらの標本値から未知の母平均 \(\mu\) と母分散 \(\sigma^2\) を推定してみましょう.
身長 \(X\) は正規分布 \(N(\mu, \sigma^2)\) に従いますので,その確率密度関数は,
\[
f(x;\mu,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{- \frac{(x-\mu)^2}{2\sigma^2}}
\]
です(\(\pi\)は円周率).男性全体(1万人)の任意のひとりの身長 \(X\) が \(a\) (cm) 以上で \(b\) (cm) 以下である確率は,確率密度関数を \(a\) から \(b\) の範囲で積分した値となります.特に,\(a\) から \(b\) の範囲,\(b-a\) が極めて小さいときは,この確率は,\(f(x_0;\mu,\sigma^2)(b-a)\)(ただし \(x_0\) は \(a\) 以上 \(b\) 以下の任意の値)で近似できます(なお,\(a = b\) のときは,確率(一点確率)は \(0\) となります).
上記の5人の身長の標本値ですが,身長の値は連続量なのに小数第2位以下は表示されていません.これは,実際は,小数第2位を四捨五入して(または 小数第2位の切り捨て等を行って)得られているかと思います.したがって,たとえば,任意の男性の身長 \(X\) (cm) が,小数第2位を四捨五入して 171.2 (cm) である確率は,
\[
P(171.15\leqq X < 171.25)
\]
ですが,近似的に,
\[
f(171.2;\mu,\sigma^2)(171.25-171.15),\mbox{すなわち},f(171.2;\mu,\sigma^2)\times 0.1
\]
となります.
(小数第2位を切り捨てた場合も同様にして,近似の確率 \(f(171.2;\mu,\sigma^2)\times 0.1\) が得られます).
したがって,5人の身長の値,171.2,166.4,174.3,168.2,172.4 (cm) が得られる 確率 は,近似的に
\[
f(171.2;\mu,\sigma^2)f(166.4;\mu,\sigma^2)f(174.3;\mu,\sigma^2)f(168.2;\mu,\sigma^2)f(172.4;\mu,\sigma^2) \mbox{と} (0.1)^5 \mbox{の積} \cdots (1)
\]
で与えられます.ここで,一般に
\[
L(\mu,\sigma^2; 171,2, 166.4, 174.3, 168.2, 172.4) = f(171.2;\mu,\sigma^2)f(166.4;\mu,\sigma^2)f(174.3;\mu,\sigma^2)
f(168.2;\mu,\sigma^2)f(172.4;\mu,\sigma^2) \cdots (2)
\]
と記します(略して \(L(\mu,\sigma^2)\) と記しても良いです).これは \((\mu,\sigma^2)\) の 「尤度(ゆうど)関数」 と呼ばれています.この尤度関数は 5人の標本値を固定して,未知の母平均 \(\mu\) と母分散 \(\sigma^2\) の関数となっています.(補足ですが,身長 \(X\) の分布のように連続型分布の場合,尤度関数は確率ではありませんので注意してください).
母平均 \(\mu\) と母分散 \(\sigma^2\) は未知で我々にはわかりません.正規分布 \(N(\mu, \sigma^2)\)から得られた5人の身長の標本値ですが,これらの値が得られる 確率(すなわち,式 (1)) が最も大きい母平均 \(\mu\) と母分散 \(\sigma^2\) をもつ正規分布から これらの標本値が得られたと考えるのは自然であります.
そこで,得られた5人の身長の値(標本値)は固定して,母平均 \(\mu\),母分散 \(\sigma^2\) をすべての範囲で動かして, 確率(1) を最大にする母平均 \(\mu\) と母分散 \(\sigma^2\) を求めることにします.すなわち, 尤度関数 (2) を最大にする母平均 \(\mu\) と母分散 \(\sigma^2\) を求めることにします.最大値の求め方は省略しますが(下記の参考文献を参照),母平均 \(\mu\) と母分散 \(\sigma^2\) の最大値は,最尤推定値 と呼ばれており,それぞれ,\({\overline x}\)(標本平均値)と \(s^2\)(標本分散の値)となります .ここに,
\[
{\overline x} = \frac{~1~}{5}(171.2 + 166.4 + 174.3 + 168.2 + 172.4) = 170.5
\]
\[
s^2 = \frac{~1~}{5}\left((171.2 - {\overline x})^2 + (166.4 - {\overline x})^2 + \cdots + (172.4 - {\overline x})^2 \right) = 8.1
\]
となります.なお,母分散 \(\sigma^2\) の平方根である母標準偏差 \(\sigma\) の最尤推定値は \(s = 2.9\) となります.(なお,ここではこれらの値は小数第2位を四捨五入しています).
(意味)
上記で説明した考え方からして,得られた5人の身長の値(標本値),171.2,166.4,174.3,168.2,172.4 (cm),は 母平均が 170.5 cm で母分散が 8.1 (すなわち,母標準偏差が 2.9 cm)の正規分布 \(N(170.5, 8.1)\) から得られた可能性が一番高いことを示しています.つまり,これら5人の標本値は,他の無数考えられるどのような正規分布 \(N(\mu, \sigma^2)\),(ただし \((\mu, \sigma^2)\) は \((170.5, 8.1)\) でない任意の値), よりも正規分布 \(N(170.5, 8.1)\) から得られた 可能性(確率)が最も高い ことを示しています.
得られた標本は,その標本値が得られる確率が(最も)大きい分布から出現したと考えるのは自然ですので(ただし,いつも標本はそのような分布から得られるということではありませんが,自然な考えとして),最尤推定値は 「最(もっと)も尤(もっと)もらしい」 自然な推定値といえます.
(なお,上記の身長の例で,これから調査に出かけて測定し,これから得られる,たとえば,5人の標本 \(X_1, X_2, X_3, X_4, X_5,\) に対して(まだ測定してないので1万人中の誰が選ばれるかわからない段階で),\({\overline x}, s^2\), に相当する理論式は, 最尤推定量 と呼ばれています(通常,大文字で \({\overline X}, S^2 \)と記して).そして,実際に身長を測定して得られた標本値に基づいて計算した値(数値)は 最尤推定値 と呼ばれています(通常,小文字で \({\overline x}, s^2 \)と記して).
Q3
最尤推定量は自然な推定量でしょうか?
A3
最尤推定量は,統計学の推定量の考え方や求め方を知らなくても 我々が日常でも自然と使っている推定方法と思います.たとえば,次の例を考えてみましょう.
(例 1) 公園で柴犬に出会う確率はどれくらいと推定できるでしょうか?
犬も入園可能な非常に広い大きな公園を考えてみましょう.最近は犬を飼っている人が増えて公園に散歩に連れてきている人が多いです.その広い公園に行ったとき,たとえば,「柴犬」 に出会う確率を推定してみましょう.今,5人のひと(標本)が,それぞれ,(朝とか夕方とか時間帯を決めて)その公園に行って,初めて柴犬に出会うまでに,柴犬以外の犬(たとえば,トイプードル,マルチーズ,ポメラニアン,秋田犬など)に何回出会ったかの回数を \(X\) (回)とします.たとえば,ある人がその公園で散歩(あるいはジョギング等)していて 5回目に初めて柴犬に出会ったとすると \(X = 4\) です.(詳細は略しますが,\(X\) は幾何分布に従います \((X=0, 1, 2, \cdots)\)).
5人のひとが,それぞれ,初めて柴犬に出会うまでに,柴犬以外の犬種と出会った回数 \(X\) が,4回,6回,9回,12回,5回でした.これらの値(標本値)から,この公園へ来たとき,柴犬に出会う確率を推定してみましょう(ただし,天気,気温,時間帯等の諸条件はほとんど変わらない場合を考えます).
これら5人のひとが柴犬以外の犬と出会った総回数は,4 + 6 + 9 + 12 + 5 で合計 36回です.また,5人のひとは1回ずつ最後に柴犬と出会っていますので,5人の合計で柴犬とは 5回出会っています.したがって,自然な考えとしては,柴犬に出会う可能性は,5/(36+5) = 5/41(約 0.122).したがって,この公園へ来たときに柴犬に出会う確率は,約 0.122,つまり,12.2 % であると推定できます.実は,この値は 最尤推定値 です.なお,ここでは幾何分布の場合の最尤推定量の求め方は省略します(統計学の専門書等をご覧下さい).このように最尤推定量は我々が日常でも用いている自然な推定量かと思います.
(補足)
(例 1)で, \(X (X = 0, 1, 2, \cdots)\) は幾何分布に従いますが,\(Y = X + 1 \) とおくと,\(Y (Y = 1, 2, 3, \cdots)\) も幾何分布に従います.この場合,\(Y\) は初めて柴犬に出会うまでに出会った犬の数です(ただし,柴犬も数に含めます).この場合も もちろん この公園に来たときに柴犬に出会う確率は,同じく,約 0.122 と推定できます(詳細は略).
(例 2) ある日のテーマパークの入園者数は何人と推定できますか?
あるテーマパークには数多くの楽しいアトラクションがあり,全国から多くの人がやってきて入場制限が行われるくらいの人気があります.ほとんどの人が朝の開園と同時に入園し,途中から来る人はほとんどいないようです.ある日のこのテーマパークの入園者数を推定してみましょう.
入園者は朝から夕方(あるいは夜)まで途中で帰らずに一日中いるようです.この日は午前のある時間に特別に来園者 200人 にアトラクション割引券をプレゼントしました.午後に来園者の任意の 400人 に午前配布したアトラクション割引券をもらったかどうか確認したところ,6人 が割引券を持っていました(なお,割引券をもらった人は皆さん割引券をなくさずに大事に持っているようです).これらのことから,この日にここのテーマパークに入園した人は何人と推定できるでしょうか.(詳細は略しますが,もし 400人中,\(X\) 人が割引券を持っていたとすると \(X\) は超幾何分布に従います).
この日のここのテーマパークの全入園者数を \(N\) 人として,この未知の \(N\) 人を推定してみましょう.今,\(N\) 人中 200人が午前にアトラクションの割引券をもらっています.また,午後に確認したとき来園者の任意の 400人中 6人が午前中に割引券をもらっていました.したがって,自然な考え方としては,午前中に割引券をもらった人の割合,つまり,\(200/N\),は,午後に確認したときの 400人中割引券を持っている人の割合,つまり,6/400 にほぼ等しい(近似できる)と考えるのは自然であるかと思います.
そこで,\(200/N = 6/400\) とおいてみると,\(N = 13333.3\) となります(ただし,少数第2位は四捨五入してあります).人数の推定なので整数で考えて,結局,この日のここのテーマパークは 約13,333人の入園者があったと推定できます.実は,この値は 最尤推定値 です.
なお,ここでは超幾何分布の場合の最尤推定量の求め方は省略します.(専門的になりますが,超幾何分布の尤度関数 \(L(N+1)\) と \(L(N)\) との比が 1 よりも大きいか(小さいか,あるいは等しいか)を調べて最尤推定量を導出します(導出はやや面倒であります).詳細は統計学の専門書等をご覧下さい).この例でもわかりますように最尤推定量は我々が日常でも用いている自然な考え方かと思います.
(参考文献)
[1] 国沢清典 編(2021年): 「確率統計演習2 統計」 (培風館)
[2] 小林正弘・田畑耕治 著(2021年): 「確率と統計 ; 一から学ぶ数理統計学」 (共立出版)
[3] 兵頭昌・中川智之・渡邉弘己 著(2022年): 「よくわかるRで身につく統計学入門」 (共立出版)
[4] 瀬尾隆 監修;下川朝有・八木文香・宮岡悦良 著 (2024年): 「入門 数理統計学演習」 (東京図書)
(註)
(1) 質問 Q1 「標本平均の平均(期待値)は,なぜ母平均に一致するのか?」については こちら からご覧下さい.
(2) 質問 Q4 「母分散の意味は何か?」については こちら
(3) 質問 Q5 「仮説検定とは何か?」については こちら
(4) 質問 Q6 「区間推定(信頼区間)とは何か?」については こちら
(5) 質問 Q7 「回帰モデルにおける偏回帰係数とは何か?」については こちら
(6) 質問 Q9 「スピアマンの順位相関係数とは何か?(特に,分割表において)」については こちら
(7) 質問 Q0 「有意水準・仮説検定・平均と分散」の日常生活と結びつけた「説明」は こちらの スライド
(8) 質問 Q11 「母共分散の意味は何か」については こちら
(9) 質問 Q13 「クラメール連関係数の最大値とその導出」については こちら
戻る |