統計教育; 統計の授業における学生からの質問(Q5) (富澤貞男)東京理科大学


 (仮説検定とは何か)


 学生から統計学に関して次のような質問をしばしば受けます.学生の皆さんに少しでもお役に立てれば幸いです.

Q5
  仮説検定とは何ですか,また仮説検定における注意点は何ですか?

A5
 次の具体例で検定の考え方,そして注意すべき点を述べたいと思います.


(例) 小学生のお年玉 2,950円 は 3,000円に近いといえるでしょうか ?

 ある市(A市として)に住んで小学3年生全体(たとえば,約 3,500 人)の集団(母集団)を考えましょう.この A市の小学3年生 3,500 人の中から任意にひとりを選んで,今年の正月にもらったお年玉の額を X (円)とします.X は平均(母平均という)μ(ミュー),分散(母分散という)σ^2(シグマの2乗)の正規分布(N(μ, σ^2)と記す)に従うとします(つまり,X の母分布は正規分布です).ここに母平均 μ (= E(X)) は未知です. ただし, 母分散 σ^2 (= V(X)) は 300 の2乗とします(過去の調査から毎年ほとんど変わらず,ここでは σ^2 は既知とします).すなわち,母標準偏差σ = 300 (円)です.

 小学3年生のお年玉は,全国的には 3,000 円が多いとの情報があります.そこで,この A市の小学3年生 3,500 人の中から任意にひとりの児童を選んで今年のお年玉の額をこれから聞いてみるとき,児童は「3,000 円もらった」と答えると期待できる(予想できる)でしょうか(つまり,母平均は 3,000 円).あるいは「 3,000 円もらってない」と答えると期待できるでしょうか(つまり,母平均は 3,000 円でない).


(解説)

 そこで,このA市の小学3年生全体(3,500 人)の今年のお年玉の(未知の)母平均 μ(円)に関して仮説を立ててみましょう.二つの仮説を考えます.一つは,帰無仮説 H0: μ = 3,000 で,もう一つは,対立仮説 H1:μ ≠ 3,000 です.ここに H0:「母平均は 3,000 円」 と H1:「母平均は 3,000 円でない」のうちのどちらか一方が に成り立っています. 帰無仮説 H0 と対立仮説 H1 のどちらが正しいのかは我々にはわかりません.

 そこで このA市の 3,500 人からなる小学3年生全体(母集団)から,任意に選んだ 400人に聞いてみることにしました.400人は3,500人の中から誰が選ばれるかわかりませんが,これから選ばれる 400人の今年のお年玉の額を X1, X2, ..., Xn (円)とします(ただし n = 400).標本平均 は M = (X1 + X2 + ... + Xn)/n (円)です.(一般に標本平均は Xバーで書きますが,ここでは M とします).実際に 400人を選んでお年玉の額を聞いたところ,標本平均 M の値(つまり 標本平均値 )は,2,950 (円)になりました. 皆さんは,この 2,950 円という値は 3,000 円(帰無仮説の下での母平均)に近いと思いますか? A市の小学3年生 3,500人全体の今年のお年玉の母平均 μ は「 3,000 円である」と判断しますか?


(検定を用いて調べてみましょう):

(考え方)

 標本平均 M は母平均 μ の一つの推定量(お年玉の例では最尤推定量)です.お年玉の例で,帰無仮説の母平均 μ = 3000 (円)の下で,もし,標本平均 M と 母平均 3000 円 のずれを示す|M - 3000| が小さければ,帰無仮説 は成り立っている,つまり,母平均は 「μ = 3000 (円)」と判断できるかと思います.しかし,もし,M と 3000 円 とのずれ|M - 3000| が大きければ,帰無仮説の母平均の値は間違っていて 対立仮説 が正しい, つまり,母平均 μ は「 3,000 (円)でない」と判断するのが自然であるかと思います.

 それでは,ずれ|M - 3000| が小さいか大きいかはどのように判断すれば良いでしょうか.ここでは確率に基づいて判断してみましょう.帰無仮説の下で,たとえば,

確率 P(|M - 3000| < k) = 0.95 を満たす k を用いて,つまり,確率 P(|M - 3000| ≧ k) = 0.05 を満たす k を用いて,もし,標本平均 M が|M - 3000| < k を満たすならば,|M - 3000|は小さいと見なして,母平均は 「μ = 3000 (円)」と判断するのは自然であるかと思います.逆に,|M - 3000| ≧ k を満たすならば,|M - 3000|は大きいと見なし,母平均 μ は 「3,000 (円)でない」と判断するのは自然であるかと思います.

 (なお,我々人間は 100 % 正確に判定を下すことは不可能ですが,帰無仮説の下でのこの確率に基づいて求めた k からして,帰無仮説「母平均 μ = 3000 (円)」が であるとき,我々は,対立仮説の「母平均 μ は 3000 円でない」と誤った判断をする確率は,わずか 0.05 であります).


(求め方)

 ところで,k の値はどのようにして求めれば良いでしょうか.一般に,標本平均 M は,正規分布 N(μ, (σ^2)/n) に従います(つまり,M の標本分布は正規分布です).したがって,この400人の児童に聞いたお年玉の例では,帰無仮説 H0;μ = 3,000 の下では,標本平均 M は,正規分布 N(3000, (300^2)/400),すなわち,N(3000, 15^2)に従います.さらに,標準化を考えて,Z = (M - 3000)/15 とおくと, Z は帰無仮説 の下では,標準正規分布 N(0, 1) に従います. そして,P(|Z| ≧ 1.96) = 0.05 が成り立ちます(たとえば,統計学の専門書の標準正規分布の数値表等から得られます).したがって,帰無仮説の下で,P(|M - 3000| ≧ 29.4) = 0.05 となります.すなわち,このお年玉の例では,k = 29.4 (= 15x1.96) です.

 さて,お年玉の例では,標本平均 M の値である標本平均値は,2,950 (円)でしたので,|M - 3000|の値は |2950 - 3000| = 50 (円)となり,k = 29.4 よりも大きな値です.すなわち,帰無仮説の母平均 μ = 3000 (円)の下で,標本平均値 2,950 円と母平均 3,000 円とのずれは大きいといえます.したがって,帰無仮説 「母平均 μ = 3000 (円)」は成り立っているとはいえず(帰無仮説を棄却して),対立仮説 「母平均 μ は 3,000 円でない」が正しいと判断します.そして,最尤推定値である標本平均値は 2,950 円でしたので,母平均 μ は 3,000 円より小さい(3,000 円でない)と推測できます.

 なお,お年玉の例では,標本平均 M の値(標本平均値)は,2,950 (円)でしたので,標準化した Z ( = (M - 3000)/15) の値は (2950 - 3000)/15 = -3.33 となります(小数第3位を四捨五入してあります).よって,帰無仮説「母平均は 3,000 円」の下で,Z は標準正規分布 N(0, 1) に従い, |Z| ≧ |-3.33| となる確率は,約 0.00087 です(この値は両側 P-値 と呼ばれています).すなわち,帰無仮説の下で,確率 P(|Z| ≧ 3.33) (= P(|M - 3000| ≧ |2950 - 3000|)) は,約 0.00087 です.これは,非常に小さい確率(なお,0.05 よりもかなり小さい)ですので,帰無仮説 「母平均は 3,000 円」は成り立っているとはいえず,対立仮説 「母平均は 3,000 円でない」が正しいと判断するのが自然であります. (つまり,この場合,小学生のお年玉の標本平均値が 2,950円 だからといって,お年玉の母平均は 3,000円 であるとはいえません).


(注意点)

 我々は,日常,2,950 円と聞くと,ほぼ 3,000 円と見なしてしまう場合がほとんどかと思いますが,このお年玉の例では,標本平均値が 2,950 円であるのに,検定を行うと,なぜ,母平均は「3,000 円でない」という判定を下すことになるのでしょう.注意すべき点として,標本平均 M の分散 (σ^2)/n の平方根である 標準偏差(つまり,標準誤差), σ/√n, がどれくらいかを見ることが重要であると思います.

 実際,標本平均 M の 標準誤差 σ/√n は, (σ=) 300 (円)を (n=) 400 (人)の平方根(すなわち 20)で割って,15 (円)です.非常に小さいです.標本平均 M は正規分布に従っていますので,標本平均 M が 3x(標準誤差)の範囲,すなわち,区間 [μ - 15x3, μ + 15x3] に入る確率は,理論的に,およそ 0.997 (ほぼ確率 1) ですので,もし,帰無仮説が正しい,すなわち,母平均が μ = 3,000 (円)とするならば,帰無仮説の下で,標本平均 M が区間 [3000 - 15x3, 3000 + 15x3],つまり,区間 [2955, 3045] に入る確率はほぼ 1 であります.したがって,400人の児童から得られた標本平均値 2,950 円が,帰無仮説の下で得られることはほとんどあり得ないことであります.したがって,帰無仮説を棄却して,対立仮説「母平均 μ は 3,000 円でない」と判定するのは自然であると思います.

 なお,帰無仮説の下で,標本平均 M の2x(標準誤差)の範囲,すなわち,標本平均 M が区間 [3000 - 15x2, 3000 + 15x2],つまり,区間 [2970, 3030] に入る確率は,理論的に,ほぼ 0.95 です.このことからも得られた標本平均値 2,950 円が,帰無仮説の下で得られることはほとんどあり得ないことであります. ここに 15x2 と上記の k = 29.4 (= 15x1.96) は近い値であることに注意しましょう.標本平均が正規分布に従う場合,得られた標本平均値が,帰無仮説の下で, 2x(標準誤差)の範囲に入っているかどうかを考えると良いかもしれません.

 推定や検定を行うときは,標本平均値だけで判断するのでなく,「標本平均値とその標準誤差をセット」 で考えて判断することが重要であると思います.


(補足 1)

 一般に,中心極限定理より,標本数 n が大きいときは,(母分布が何であっても(離散型でも連続型でも))標本平均 M は近似的に正規分布に従います.なお,上記のお年玉の例のように,母分布が正規分布のときは,標本数 n が小さくても 標本平均 M は(近似でなく)正規分布に従います.


(補足 2)

 上記の本文中で,「帰無仮説「母平均 μ = 3000 (円)」が真であるとき,我々は,対立仮説の「母平均 μ は 3000 円でない」と誤った判断をする確率は,わずか 0.05 であります」と述べましたが,補足すると, 帰無仮説が真 であるとき(真であるかどうかは我々人間にはわからず,強いて言うならば,神様しかわかりませんが),我々人間が,そのとき,対立仮説が成り立っているという判断を下す場合,それは誤った判断ですが,これは「第1種の誤り」 と呼ばれています.

 この「第1種の誤り」を犯す確率を小さくしたいのですが,ここでは 確率 0.05 (あるいはそれ以下)に抑えることを考えて,この最初に与える(決めておく)確率 を「有意水準」と言います.一般には α(アルファ)としますが,通常慣習的に,α = 0.05, α = 0.01 等が用いられます.

 (なぜ,この値が用いられるのかは,日常生活と結びつけるとよくわかります.それに関しては,たとえば,こちらの スライド をご覧下さい).

 さらに補足すると,一般に,有意水準 α と第1種の誤りを犯す確率との関係ですが,第1種の誤りを犯す確率の最大値を有意水準 α 以下にします.やや難しい話で恐縮ですが,帰無仮説が複合仮説のときや離散型分布のときなどでは,この考えが必要になります. なお,上記のお年玉の例では,第1種の誤りの確率と有意水準を一致させて 0.05 としました(そしてそれを満たすように k の値が k = 29.4 と求まりました) .

 また, 対立仮説が真 であるとき,我々は帰無仮説が成り立っているという判断を下す,誤った判断は,「第2種の誤り」と呼ばれています.(これらの詳細に関しては統計学の専門書をご覧ください).


(補足 3)

 上記の本文中で,標本平均 M を用いて,|M - 3000| ≧ k (ただし K = 29.4),の範囲に M の値が入れば,帰無仮説「母平均 μ は 3,000 (円)」は成り立たたない,と判断するのは自然,と述べましたが,少し補足しておきます.有意水準を 0.05 として,この M の取り得る範囲(R と記すと)R = {M ||M - 3000| ≧ 29.4 } を「棄却域」 と言います.同じことですが,標準化した Z = (M - 3000)/15 を用いると,棄却域(R* と記すと)は,R* = {Z ||Z| ≧ 1.96 }となります.

 もし,標本平均 M の値(標本平均値)が,棄却域 R に入ったならば(つまり,Z の値が,棄却域 R* に入ったならば),帰無仮説 H0 を 棄却(reject) して,我々は,対立仮説 H1 が正しいと判断します.逆に,M の値が,棄却域 R に入らないならば,帰無仮説 H0 を 採択(accept) します.(これらの詳細に関しては,統計学の専門書をご覧下さい).


(補足 4)

 確率「1−(第2種の誤りを犯す確率)」は,検出力 (power) と呼ばれており,検出力の大きい検定が望ましいです. 検定 は(第1種の誤りを犯す確率を有意水準(たとえば,0.05)以下にして),一般に,棄却域は 無数 作ることができますが,その中で,「検出力」が 大きく なる(すなわち,「第2種の誤りを犯す確率」が小さくなる)棄却域を用いて検定するのが望ましいです.つまり,検出力が(最も,あるいはできる限り)大きくなるように棄却域を定め,検定すること重要です.


(補足 5)

 上記のお年玉の例で,標本平均値は 2,950 円でしたが,有意水準 0.05 で,この値(2,950 円)は,帰無仮説「母平均 μ は 3,000 (円)」からの ”ずれ” が,誤差範囲を超えて,偶然ではなく,「意味のある値である」と判断し,我々は,帰無仮説を棄却して,「対立仮説が正しい」と判定しました.この場合,(帰無)仮説は「有意」 であると呼ばれています.この得られた標本平均値と帰無仮説の母平均との ”ずれ” は 有意 であります.検定は,「仮説の有意性」をみる検定といえます.


(補足 6)

 (補足 2)で述べました「第1種の誤りを犯す確率」と「第2種の誤りを犯す確率」ですが,もちろん,両方とも確率が 0 で(あるいは限りなく 0 に近く )あれば良いのですが,それは(理論的に)不可能です.そこで,第1種の誤りに重点をおいて,その確率を有意水準以下にします.これは,帰無仮説と対立仮説の立て方に依存してきます.たとえば,「薬の有効性」に関する検定の例で考えるとわかりやすいかと思います.これらに関して,こちらの スライド で説明してありますので,よろしければ ご覧いただければ幸いです.


(「検定」に関する キーワード)

仮説(帰無仮説,対立仮説),棄却域,有意水準,棄却(reject),採択(accept),第1種の誤り,第2種の誤り,検出力,有意,P-値


(参考文献)
国沢清典 編(2021年): 「確率統計演習2 統計」 (培風館)


(註)

(1) 質問 Q1 「標本平均の平均(期待値)は,なぜ母平均に一致するか?」については  こちら からご覧下さい.

(2) 質問 Q2 「最尤推定量の意味は何か(定義や求め方でなく)?」については  こちら 

(3) 質問 Q4 「母分散の意味は何か?」については  こちら 

(4) 質問 Q6 「区間推定(信頼区間)とは何か?」については  こちら 

(5) 質問 Q7 「回帰モデルにおける偏回帰係数とは何か?」については  こちら 

(6) 質問 Q9 「スピアマンの順位相関係数とは何か?(特に,分割表において)」については  こちら 

(7) 質問 Q0 「有意水準・仮説検定・平均と分散」の日常生活と結びつけた「説明」は こちらの  スライド  

(8) 質問 Q11 「母共分散の意味は何か」については  こちら

(9) 質問 Q13 「クラメール連関係数の最大値とその導出」については  こちら

戻る