入門統計学 第6章 仮説検定と検出力

入門統計学-第6章のスライドから

(本章と次章で)仮説検定を学ぶと何を検証できる?

  • 病気かどうかの判断
  • 薬の効き目の有無
  • 機械導入効果の有無
  • 特定の値と標本平均を比較したり,
  • 処理前後の 標本平均を比較することで, その背後にある母集団の平にも差があるか否かを判定できる
  • 平均だけで なく分散なども比較できる

仮説検定の長所

  • 点推定や区間推定は,あくまで推 定量や誤差を数値で表すだけ

    統計学を学んでない人にはわかりにくい

  • 仮説検定ならば「処理の効果がある!」とはっきりいえるため,

    誰にでもわかりやすく伝えられるで,結局,この薬は効くの かしら? 白黒 はっきりして,わかりやす い!

仮説検定と検出力

仮説検定:母集団に対して主張したくない 仮説(処理の効果がない等)を立て,その 仮説が間違いであることを,実験結果の起 き難ささから判断する。 検出力:母集団の特性に差があるときに, ちゃんと“差がある”と判断できる能力。検定 の性能を表す指標で近年重視されている。

6.1 検定の概要

  1. 仮説の設定:つまらない仮説(帰無仮説)を立てる
  2. 検定統計量の計算:実験データから求める
  3. 確率の計算:実験結果の起こりやすさ(確率)を求める
  4. 仮説の判定
    • 4.1 仮説は正しい

      よく起きることが起きただけ

    • 4.2 仮説は間違い

      滅多にしか起きないことが起きたので 棄却

仮説検定の大まかな手順

手順1 仮説の設定
母集団における未知の事実を説明するため,とりあえず正しいものと仮定し ておく道筋を立てる
手順2 検定統計量の計算
観測されたデータのままでは検定できるこ とは少ないので,目的に沿った 検定のため の統計量を求める (ただし,本章ではこの手順をスキップでき る基本的な検定から解説する)
手順3 確率の計算

仮説が正しい下での実験結果の起こりやすさ(確率)を計算。

実際には,確率計算は難しいので,仮説の分布のどれぐらい端の方に位置し ているのかで仮説の是非を判定

手順4 仮説の判定
  • 滅多に起きないことが起きたといえるぐらい確率が低いならば,

    そもそもの仮説が間違いだったと判断。

  • そうでなければ判定を保留する

    (仮説が正し かったとはいわない)

6.2 仮説の設定
 (手順1の説明から)

母集団に立てる仮説には, * 帰無仮説 (H0) *と * 対立仮説 (H1) *の2つがある

  • 基本となるのは帰無仮説で,帰無仮説が棄却されたときに採択する仮説が対立 仮説

帰無仮説は「主張したい内容とは逆の,つまらない内容」とする

処理効果が無い (2群の母平均に差は無い)

なぜ主張したい内容としないのだろうか?

帰無仮説の内容

殺虫剤の効果を検定する場合

主張したいのは「使用効果がある (使用前後で害虫数に差がある)」という内 容だが…

それを検証するためには「*匹減る」と具体的にわかってなけれならない (無 限に設定できる)

使用効果がない(全く減らない)としておけば,それと矛盾した結果が観測さ れれば,効果があるといえる (* 背理法 *)

6.3 (1標本の)母平均の検定


検定統計量が不要(容易)な検定から学びます

  • 特定の既知の値と観測された標本平均とを比較し,
    • その差が偶然(誤差)の範囲内なのか,
    • 母集団においても差があるといえるほど大きい差なのかを判定する
  • 普遍的なことをいうために, 母平均を考える

    標本平均は,あくまでも標本

  • 比較対象が与えられているので,検定が簡単 (離れ具合が (既知) 比較 わかりやすい)

母平均の検定の適用例

  • 病気の疑いのあるグループの平均と正常値とを比較して,病気か健康かを判 定
  • 製造している商品の容量が袋に表記されている基準値と異なっていないかを 確認
  • 調査した農家の平 均年齢が真の値からズレていないかを検証

検定の原理

分布の母平均 μ を仮定,標本平均 \( \overline{X}_{n} \) を計算

真の値なので,よく 起きる(確率が高い)

滅多に起きない区間

  • 実験結果が両端に来たら,こ の分布は真の分布ではない

    実験結果の平均値が両端に位 置するならば,この分布ではなく 別の分布に 従っていると考える

ステップ1:2つの仮説を考える

帰無仮説 H0:μ=μ0
同じ母集団から抽出 (μ0は𝑥 ̄ の真の値)
対立仮説 H1:μ≠μ0
異なる母集団から抽出 (μ0は𝑥 ̄ の真の値ではない)

対立仮説の内容は3種類

普通はどち らが大きいかはわからないため,両側検定を基本とする

パターン1 μ≠μ0

両側検定

どちらが大きくなるかは不明 (とにかく差があることに興味がある)

パターン2 :μ<μ0

片側検定

比較値μ0が標本の母平均μより も大きいと仮定できる (あるいは比較値の 方が小さいことには興味がない)

パターン3 μ>μ0

片側検定

比較値μ0が標本の母平均μより も小さいと仮定できる(あるいは比較値の 方が大きいこ片側検定の方が差があることをいいやすいが,と には興味がない)

ステップ2: 帰無仮説が正しい場合の
 標本の位置は?

  • μ0を真の値とした母集団から抽出した標本分布(比較対象)
  • μを真の値とした母集団から抽出した標本分布 (観測された標本の分布)
棄却域
離れた値をとるならば帰 無仮説が間違っている 可能性が高い
帰無仮説の受容域
帰無仮説が正しいなら, 標本平均は比較値μ0と近い値を取りやすい

ステップ2:
 帰無仮説が間違っている場合は?

帰無仮説の分布
μ0を真の値とした標本分布 (比較対象)
対立仮説の分布
μを真の値とした標本分布 (観測された標本分布)

異なる母集団から抽出されたので標本分布も離れている

帰無仮説が間違っているなら,標本平均はμ0と離れた値を取りやすい

どれぐらい離れていれば帰無仮説は間違い?

ステップ3: どこから帰無仮説を棄却する?

  • 任意の有意水準 (一般的にα=5%とする)
  • に対応する値を基準(限界値)として,
  • 帰無仮説の是非を判定

ステップ4: 検定統計量(観測された標本平均)と比較する

正規分布 (中心極限定理より) 有意水準α/ 2=0.025 有意水準α/ 2=0.025 帰無仮説の分布 母標準誤差(標本平 均𝑥 ̄ の母標準偏差) μ0 𝑥 ̄ μ0 −1.96σx 受容 𝑥 ̄ 𝑥 ̄ 棄却 μ0 ±1.96σx z分布表から上側確率が 0.025になるz値を読み取る (区間推定と同じ) μ0 +1.96σx これぐらいの差ならば 偶然に観測されるこ とがある(帰無仮説は 間違いとはいえない) 滅多に起きないぐらいの 大きな差なので,別の分 布に従う(帰無仮説は間 違い)→有意差がある

ステップ4の補足: p値を使った検定法
 (ソフトウェアが必要)

p値 𝑥 ̄ 実験で観測された標本平均 𝑥 ̄ (検定統計量) p値:帰無仮説の下で,実験結果(検定統計量)よりも極端な値 が観測される確率 →p値を有意水準αと比較して“p<α”ならば帰無仮説を棄却(有意)

例 題

6.5 検出力分析

1実施した検定の能力(検出力)はどのぐらいだったのかを 示すのが重要になってきている 2処理効果(2群の差)そのものの大きさ(効果量)を推定 することも重要になってきている →こうした検出力や効果量を求めて検定の良し悪しを評価し たり,望ましい標本サイズを事前に決める分野を検出力分 析と総称 →検出力分析の基本は,検定における2種類の間違い(統計 的過誤)なので,まずはこれから解説

統計的過誤は

標本を用いている以上,仮説検定で間違った判断(統計的 過誤)を下してしまうこともある 第一種の過誤:処理効果(群間で差)が無いのに有ると判 断してしまう間違い→帰無仮説が真なのに棄却してしまう過 ち(確率はαで表す) 第二種の過誤:処理効果(差)が有るのに無いと判断して しまう間違い→帰無仮説が偽なのに棄却しない(真の対立 仮説を採択し損なう)過ち(β) それぞれを図解すると… 2 種類

第一種の過誤 (TypeIerror)

本当は差が無いのに こちらを採択 (差は有ると誤判定) 対立仮説の分布 (間違っている) 限 界 値 α/2 帰無仮説の分布 (正しい) 限 界 値 α/2 検定統計量が帰無仮説の 分布で端の値を取ると… これが有意水準(検定で許容 できる第一種の過誤の上限) この検定で帰無仮説が正しいの に棄却してしまう確率(危険率) →帰無仮説分布上の確率

第二種の過誤 (TypeIIerror)

β 検定統計量が対立仮説の 分布で端の値を取ると… 本当は差が有るのに こちらを採択できない (差はないと誤判定) 対立仮説の分布 (正しい) 限 界 値 帰無仮説の分布 (間違っている) ここまでがβ この検定で帰無仮説が間違っ ているのに受容してしまう確率 →対立仮説分布上の確率

第一種と第二種の過誤では どちらが重大(致命的)?

例えば,効果が無い薬を売り出した場合(第一種過誤) と,効果が有る薬を開発したのに売り出せない場合(第二 種過誤)では,どちらが製薬会社にとって致命的なダメー ジとなるか? →第一種の過誤の方が致命的な事が多い →その検定で許容できる第一種の過誤を犯す確率α(有意 水準)を小さく設定するのが一般的 →α=0.05は,実験と検定を100回実施しても5回までしか 過誤を許さないということ

)

第二種の過誤の方が致命的な事例

一旦,効果(差)を見逃してしまったら,取 り返しの付かない場合 →下例で正しい対立仮説を採択し損ねたら? 事例1:環境保護政策の効果の検定 (H0:効果無し,H1:効果有り)→ 環境は一度破壊されたら二度と戻らな い 事例2:食品添加物の毒性の検定(H0: (あまりないですが… 毒性無し,H1:毒性有り)→毒の入っ

第二種の過誤を抑えた検定はどうやる?

有意水準αのように,その検定で許容できる できない

第二種の過誤確率βを事前に設定すれば良い? 理由:対立仮説の分布の確率計算が難しいから →帰無仮説分布からの離れ具合(非心度)によっ て対立仮説分布の形状が変わる(図を次掲) →非心度は実質的な差(効果量)と標本サイズか ら決まるため,事前(検定前)に計算できない →対立仮説を判定するためのβに対応する限界値は 不明(有意水準の限界値を便宜的に共有する)

対立仮説の分布(非心分布)

t分布 非心t分布上の 確率計算は困難 対立仮説 非心t分布 (非心度によって形が変化) 帰無仮説 β 非心度 (標本サイズと効果量によって決まり,zやt検定では検定統計量そのもの) 実質的な差の大きさなので事前には不明 注:自由度が関係ない(標準)正規分布の場合,対立仮説の分布でも形は不変

効果量

(注:検定によって計算式は色々ある) 母集団が持つ処理効果そのもの(実質的な差)の大きさ 母平均の検 d=μ−μ0 定の効果量 未知 σ 標本の母平均μと比較値μ0の差が母標 準偏差σ(標準誤差ではないので標本サ イズとは無関係)の何倍なのかを示す →観測された標本から検定後に推定でき る 検定統計量 母平均の検定 x−μ t 推定した効果量から非心度 ˆ 0 or d = 不偏標準偏差 を推定すれば,対立仮説分 n 布の確率βも計算できる の推定効果量 σˆ

効果量を検定結果に加えよう!

検定は標本サイズに影響を受けるが,効果量は標 本サイズと関係ない →検定結果が有意でなくても効果量が大きいことも ある(逆に,有意でも効果量が小さいこともあ る) →検定統計量を差(効果)の大きさと勘違いした り,有意でなかったときに処理が全く無意味と思 われないように,推定効果量も書いておく

第二種の過誤が致命的な場合の対処法に戻って…

大きな標本サイズで 非心度・小 βを抑える 非心度・大 帰無仮説 対立仮説 β 2.5 標本サイズを 大きくすると… (効果量と αは同じ) 対立仮説 β 2.5 帰無仮説 標本サイズの大きな実験を計画することで,βを小さくできる (任意のαの下で望ましいβになるような,おおよその標本 サイズを逆算して実験を計画すればよい→ソフトウェアを 使った標本サイズの決め方を最後に解説)

第二種の過誤を抑えるもう一つの裏技

αを大きくして βを小さくする αを大きくすれば… αとβで共用している限界 値(の絶対値)を小さくする 帰無仮説 対立仮説 βα/2 対立仮説 β α/2 (効果量と標本 サイズは同じ) 帰無仮説 第一種の過誤が致命的でないなら,有意水準αの許容を大きくすること で,αとトレードオフ関係にあるβは小さくなる (ただし,よほどデータを集めるのが困難な場合を除いて用いられない)

検出力

を使ってきましたが… 第二種の過誤確率βよりも,その補数(1-β)である検出力を考え る方がわかりやすい →本当に処理効果(差)があるときに,「ある」といえる能力 ここまで β 限 界 値 限 界 値 β 対立仮説 (正しい) 帰無仮説 (間違い) 検出力 (1-β) ここから下側も 検出力(1-β) この検定で,正しい対立 仮説を採択できる確率

検出力も検定結果に加えよう!

検出力は,その検定の能力を表している p値や有意水準のみでは,正しい対立仮説を 高い確率で採択し損なっていてもわからない 事後(検定後)ならば計算できるので,検定 結果に書いておくと良い →非心分布の確率計算は難しいので,G*power などのソフトウェアが必要

検出力の計算(事後分析)

効果量d 標本サイズn 検出力(1- β) 非心度 (対立仮説分布 の離れ具合) βとトレードオフ 検出力は3つの要素から決まる(これら3要素をパラ メータとして,ソフトウェアに入力すれば計算できる) 有意水準α

ソフト(G*power)を使った検出力計算

痛風の例題で推定してみると… 効果量は1.57,検出力は0.75 母平均のt検定 事後分析(検出力の計算) 非心度(zやt検定では検定統計量) 計算された検出力 比較値μ0 標本平均� ̄ 3つのパラメータを入力 計算された効果量 不偏標準偏差σ^

標本サイズの計算(事前分析)

任意の有意水準の下で望ましい検出力になるような 標本サイズを事前に求める(効果量は予想するしかな い) 標本サイズn 効果量d 有意水準α 検出力(1- β) 関連データがあれば推定し,なけ れば検定ごとに示されている目安 を使う(母平均の検定で0.2~0.8) 0.05(5%)がもっとも一般的 0.8(80%)程度で良いだろうと コーエンが提唱

ソフト(G*power)を使った標本サイズの計算

大きい効果量(0.8)が得られると予想されるな ら,一般的な有意水準(0.05)と検出力(0.8) の検定を実現するための標本サイズは… n=15 効果量の目安 母平均のt検定 事前分析(標本サイズの計算) 計算された標本サイズ 注:第二種の過誤が致命的な場合は, 検出力か有意水準αを大きく設定する 3つのパラメータを入力

以上で第6章は終了で

Author: suzuki@iwate-u.ac.jp 鈴木正幸,非常勤講師

Created: 2021-12-16 木 13:21

Validate