(母共分散 の意味は何か)
学生から統計学における「母共分散」の意味について,しばしば質問されます; 以下に説明したいと思います.学生の皆さんに少しでもお役に立てれば幸いです.(なお,「母分散」については質問 (Q4) をご覧下さい).
Q11
「母共分散」の意味は何ですか?
A11
推測統計学における母共分散は何を意味しているのかを次の具体例で説明したいと思います.
たとえば,日本人20歳の男性全体(約60万人位でしょうか)の集団(母集団)を考えましょう.この約60万人の男性全体からの任意のひとりを選んだときの身長を
母共分散(その1)
男性全体(母集団)から任意にひとりを選んで身長と体重を測定するとき,これから調査に出かけて測定する前に,これから選ばれる人の身長
母共分散(その2)
一方,別な考え方として,この60万人の男性全体(母集団)から任意に独立なふたりを選び((身長,体重)に関してふたりの値が影響し合わないような全くの他人どおし(たとえば,双子等でなく,あるいは,食事が同じような寮生活等をしている人でなく)),その任意のふたり(仮にAさんとBさんとして)の(身長,体重)を Aさんは
したがって,母共分散
(註1)
母共分散
なお,(身長と体重は関連があると思いますが),もし,身長と体重は関連がない(つまり身長
(補足)
ちなみに,
標本共分散(その1)
上記の日本人男性(約60万人くらいか)の母集団から
標本共分散(その2)
また,標本共分散
(例 1) 「ある市の小学生全体の集団(母集団)」において教科の,たとえば,「算数」と「音楽」の成績に関する母共分散(あるいは母相関係数)を推定して見ましょう.
(なお,この例では,算数と音楽の成績の各母平均を推定することは不可能(標本平均が求まらない)ということに注意しましょう).
実際に3人の児童に対して算数と音楽の「成績の差」のみを知ることができたとします.なお,直接の成績は教えてもらうことができないとします.(ここでは標本数は
標本共分散
なお,算数の母分散
Q12
「母共分散」はオッズ比 (odds ratio) を用いてどのように表せますか?
A12
(準備)
連続型でも(下記の(註5)のように)同様に表せますが,ここでは離散型を中心に説明します.確率変数
(註2)
ところで,行変数
(Q12の回答)
(註3)
したがって,式(3)から,(i) すべてのオッズ比が1よりも大きいならば,母共分散の値は正となることがわかります(なお,逆は必ずしも成り立つとは限りません).また,(ii) すべてのオッズ比が1よりも小さいならば,母共分散の値は負となることがわかります.さらに,(iii) すべてのオッズ比が1に等しい(つまり,
(註4)
オッズ比の構造を示した Goodman (1979) の一様連関モデルは次のように与えられます(参考文献 [5][6]):
(註5)
連続型の確率変数
特に,2変量正規分布のときは,オッズ比部分は次のようになります:
(註)
確率密度関数のオッズ比に関する別なアプローチとしては,たとえば,文献 [7][8][9]参照.
(参考文献)
[1] 清水邦夫 著 (2020年): 「相関係数」 (近代科学社)
[2] 瀬尾隆 監修;下川朝有・八木文香・宮岡悦良 著 (2024年): 「入門 数理統計学演習」 (東京図書)
[3] Tomizawa, S., Miyamoto, N. and Sakurai, M. (2008): Decomposition of independence model and separability of its test statistic for two-way contingency tables with ordered categories. Advances and Applications in Statistics, Vol.8, pp.209-218
[4] Tahata, K., Miyamoto, N. and Tomizawa, S. (2008): Decomposition of independence using Pearson, Kendall and Spearman's correlations and association model for two-way classifications. Far East Journal of Theoretical Statistics, Vol.25, pp.273-283.
[5] Goodman, L.A. (1979): Simple models for the analysis of association in cross-classifications having ordered categories. Journal of the American Statistical Society, Vol.74, pp.537-552.
[6] Agresti, A. (1984): Analysis of Ordinal Categorical Data. Wiley.
[7] Kotz, S., Balakrishnan, N. and Johnson, N.L. (2000): Continuous Multivariate Distributions. Wiley, pp.73-75.
[8] Balakrishnan, N. and Chin-Diew Lai (2009): Continuous Bivariate Distributions. Springer, pp.168-170.
[9] Iki, K., Tahata, K. and Tomizawa, S. (2012): Decomposition of symmetric multivariate density function. SUT Journal of Mathematics, Vo.48, pp.199-211.
(註)
(1) 質問 Q1 「標本平均の平均(期待値)は,なぜ母平均に一致するか?」については こちら からご覧下さい.
(2) 質問 Q2 「最尤推定量の意味は何か(定義や求め方でなく)?」については こちら
(3) 質問 Q5 「仮説検定とは何か?」については こちら
(4) 質問 Q6 「区間推定(信頼区間)とは何か?」については こちら
(5) 質問 Q7 「回帰モデルにおける偏回帰係数とは何か?」については こちら
(6) 質問 Q9 「スピアマンの順位相関係数とは何か?(特に,分割表において)」については こちら
(7) 質問 Q0 「有意水準・仮説検定・平均と分散」の日常生活と結びつけた「説明」は こちらの スライド
(8) 質問 Q13 「クラメール連関係数の最大値とその導出」については こちら
戻る |