「有意水準とは何か・仮説検定・平均と分散」(Q0) (富澤貞男)東京理科大学


「有意水準とは何か・仮説検定・平均と分散」に関して,2022年4月に東京理科大学数学教育研究会において,主として高校の教諭(教科「数学」)や,大学の教職課程の「数学教育」分野の教員を対象に「数学における確率・統計」に関する講演を行いました.以下はそのときの講演スライドの一部分です:


こちらの  スライド からご覧いただければ幸いです.

なお,スライドの内容は以下のようになっていますが, スライド の方が,カラーで鮮明ですので,スライドをご覧いただければ幸いです:



(1ページ目)

(統計学の考え方(教え方)のポイント)

日常生活と結びつけて考えると学生は納得する傾向にある

(例1)
母集団から標本を取って未知の特性(平均や分散など)を高い信頼度で推測することは,

たとえば,
大鍋の料理からスプーン一杯味見すれば,大鍋全体の料理がうまくできていると推測できる(全てを味見しなくて良い),
ただし,100%当たっている保証はないがほぼ正しい.

(推測統計学は日常生活と似ている)


(2ページ目)

(例2)
テニスプレーヤーAとB

帰無仮説 H: AがBよりも弱い(または互角)
対立仮説 K: AがBよりも強い

どちらが正しいかを検定したい

第1種の誤り … Hが真にもかかわらず,Kが正しいとする誤り
第2種の誤り … Kが真にもかかわらず,Hが正しいとする誤り

ここに P(第1種の誤り) が 有意水準以下となるように,有意水準 (有意水準は通常,0.05 または 0.01)は解析前に与える(決める).

(問い)
有意水準 はなぜ多くの場合にこの値とするのか?


(3ページ目)

(日常生活と結びつけると納得できる)

AとBのどちらが強いか全くわからないとき(あるいは AがBよりも弱いとき),
1回戦でAがBに勝つ確率は 0.5 以下
2回続けたとき,その確率は 0.25 以下
3回続けたとき,その確率は 0.125 以下
4回続けたとき,その確率は 0.0625 以下
------------------------------------------------
5回続けたとき,その確率は 0.03125 以下
6回続けたとき,その確率は 0.015625 以下

多くの人が,4回(または 5回)Aが勝てば,「Aが勝者」と結論付けても納得する傾向にあるだろう.たとえ,その後,ずっとBが勝ち続け, 本当はBは真に強くても(あるいは,その後,AとBがほぼ互角に戦い続け,AとBは本当は互角であっても), 人間はそれは仕方ないことと諦めがつく確率といえるだろう.

有意水準 はこのように日常生活と結びついた値であるだろう.


(4ページ目)

(他にも先に4勝すると勝者とする例)

(1) プロ野球の日本シリーズ … 7試合中,先に4勝したチームが日本一と判定
(2) テニスは1ゲームは4ポイントを先取した方が1ゲーム獲得
(3) 将棋の名人戦や竜王戦でも7番勝負で,先に4勝した方が勝者と判定

(参考文献)
吉村功 編著 (1987年):毒性・薬効データの統計解析 サイエンティスト社


(5ページ目)

(例 3)
「帰無仮説と対立仮説」

たとえば,ある新薬開発で新薬Aと偽薬(プラセボ)Bとの比較試験で,

帰無仮説 H: 新薬Aは効果ない (AとBは同等)
対立仮説 K:  新薬Aは効果ある (AとBは同等でない)

どちらが正しいかを検定したい.

第1種の誤り・・・ 新薬Aは効果がないにもかかわらず,効果があると判断し,発売に至った場合. 患者に投与し,患者は治らなく手遅れになるかもしれない重大な誤り
第2種の誤り・・・ 新薬Aは効果があるにもかかわらず,効果がないと判断し発売しない.この場合,患者には影響なく損失は製薬会社関連など

第1種の誤りは重大な誤り.(重要なことは)

P(第1種の誤り)を小さく有意水準 (たとえば 5%)以下にする.
P(第2種の誤り)は,たとえば約20%など

(注意) 帰無仮説と対立仮説の立て方は重要. 一般に,逆にはしない


(6ページ目)

(例4)
平均と分散はセットで考える.平均だけで解釈しない

(風邪薬A)
39度以上熱のある小学6年生に薬Aを投与し,治るまでの日数の確率

\[ \begin{array}{r|rrrrrr|r} X & 1 & 2 & 3 & 4 & 5 & 6 & \mbox{計} \\ \hline p_x & \frac{4}{20} & \frac{6}{20} & \frac{4}{20} & \frac{3}{20} & \frac{2}{20} & \frac{1}{20} & 1 \end{array} \]

人によって治る日数は違うが, 平均は

E(X) = … = 2.8 日

お母さんが薬局に来て,店員にこの薬A は何日で良くなるでしょうかと聞かれたら,店員は2日半から3日ぐらいと答えれば良い


(7ページ目)

(風邪薬B)
39度以上熱のある小学6年生に薬B を投与し,治るまでの日数の確率

\[ \begin{array}{r|rrrrrr|r} X & 1 & 2 & 3 & 4 & 5 & 6 & \mbox{計} \\ \hline p_x & \frac{1}{20} & \frac{8}{20} & \frac{8}{20} & \frac{1}{20} & \frac{1}{20} & \frac{1}{20} & 1 \end{array} \]

人によって治る日数は違うが, 平均は

E(X) = … = 2.8 日

お母さんが薬局に来て,店員にこの薬B は何日で良くなるでしょうかと聞かれたら,店員は2日半から3日ぐらいと答えれば良い

(店員の説明)
薬Aと薬Bでは平均が同じなのでどちらの薬も効果に違いありません.どちらでも良いですよ.

(問い)この答え方は正しいか?


(8ページ目)

平均だけ見て答えては駄目.

平均 2.8 日から得られる判断(解釈)が,どれくらい信頼できるかが重要.

分散 が重要.分散は,

薬Aでは V(X) = E((x-2.8)^2) = … = 2.06
薬Bでは V(X) = E((x-2.8)^2) = … = 1.26

(店員の説明は,次のようにすべき)
薬Aと薬Bでは,共に2日半から3日くらいで治ると思いますが,
薬Aの方が薬Bよりも治るまでにバラツキがあり,薬Bの方が確実かもしれません.

(授業中,学生にいつも言っていること)
日常生活と結びつけて,平均だけで判断するな.どれくらい平均からの判断が確実か(信頼できるか)が重要で,平均と分散(または標準偏差)はセット で考えよ.


(9ページ目)

(まとめ)

確率・統計(特に統計)をいかにわかりやすく教えるかのポイント:
(1)統計の考え方を日常生活に例えて説明する
(2)教科書には書かれていない説明をわかりやすくする
(3)具体例を日常生活の例を持ち出して説明する



なお,医療分野における有意水準,仮説検定,2種類の誤り,P値,サンプルサイズの設計等の詳細は,たとえば,次の専門書をご覧いただければ幸いです:


(参考文献)

山本紘司 (2024年):入門 サンプルサイズ設計 - 基本理論から計算方法まで (東京図書)


戻る