分布と 分布
[Expand all][Collapse all]
#+beign_src R :tangle R-text/code/05.R #+end_src
分布- データの平方和である統計量
が従う分布- 母分散の区間推定
- 独立性の検定
分布- 二つの
の比が従う分布- 等分散の検定
- 分散分析
5.1 分布
工場で製造される製品の容量のバラツキは?
データの平方和
標準正規母集団からの無作為標本
- 母集団が正規分布の場合は,標準化する
統計量
標準化
標準化された平方和の分布
教科書等では,統計量も分布も区別せずに
自由度1のカイ二乗分布の和であるので,
は自由度。- 期待値は
, - 分散は,
- 再生成
がある
分布
- 非対称, 平均は中央にない
[copy]
curve(dchisq(x,df=1),from=0, to=10, lty=1, col=1,main="自由度によって形が変るカイ二乗分布") curve(dchisq(x,df=3),from=0, to=10, lty=1, col=2, add=T) curve(dchisq(x,df=10),from=0, to=10, lty=1, col=3, add=T) legend(2, 0.7, c("自由度=1", "自由度=3", "自由度=10"), lty=c(1,1,1), col=c(1,2,3))
5.2 母分散の区間推定
前提
- 母集団
, , は未知
分散の推定量 (標本不偏分散)
分散の推定量
信頼区間
なので,信頼区間は,
95% 信頼区間の両端点
[copy]
### ### ### print(c("自由度", "", "下限", "上限")) for (d in c(4,8,16,32,64)) { print(c(d, qchisq(0.025,df=d), qchisq(0.975,df=d))) }
[1] "自由度" "下限" "上限" [1] 4.0000000 0.4844186 11.1432868 [1] 8.000000 2.179731 17.534546 [1] 16.000000 6.907664 28.845351 [1] 32.00000 18.29076 49.48044 [1] 64.00000 43.77595 88.00405
90% 信頼区間の両端点
[copy]
### ### ### for (d in c(4,8,16,32,64)) { print(c(d, qchisq(0.05,df=d), qchisq(0.95,df=d))) }
[1] 4.000000 0.710723 9.487729 [1] 8.000000 2.732637 15.507313 [1] 16.000000 7.961646 26.296228 [1] 32.00000 20.07191 46.19426 [1] 64.00000 46.59491 83.67526
例題 (入門統計学5.2-p99)
[copy]
### ### ### sample <-c(5, 8, 10, 11, 15) mu <- mean(sample) s2 <- var(sample) d <- length(sample)-1 low <- qchisq(0.025, df=d) high <- qchisq(0.975, df=d) c(d*s2/low, d*s2/high) c(sqrt(d*s2/low), sqrt(d*s2/high)) chisq.test(sample)
[1] 113.125311 4.917759 [1] 10.636038 2.217602 Chi-squared test for given probabilities data: sample X-squared = 5.5918, df = 4, p-value = 0.2318
標本不偏分散 ( )の標本分布を求める
- 不偏分散は,母分散の不偏推定量
- 標本分散は,標本の散布度
[copy]
## ## 標本不偏分散の標本分布 ## samples.no <- 10000 # いくつ標本を用いるか sample.size <- 10 # ひとつの標本の中のデータの個数 this.mean <- 50 # 分布の平均 this.sd <- 10 # 分布の標準偏差 不偏分散s <- numeric(samples.no) # 各々の標本の不偏分散値の保存場所 for (i in 1:samples.no) { 標本 <- rnorm(n=sample.size, mean=this.mean, sd=this.sd) # ひとつの標本の生成 不偏分散s[i] <- var(標本) } c(mean(不偏分散s),sd(不偏分散s)) # 標本不偏分散達の平均と分散
[1] 99.74877 46.92062
[copy]
## ## 標本不偏分散の頻度表 ## hist(不偏分散s, breaks=seq(0,500,10), main="不偏分散の分布")
不偏分散の分布
[copy]
## ## 標本不偏分散の頻度表 ## hist((不偏分散s/100)*9, freq=FALSE, breaks=seq(0,50,1), main="不偏分散/母分散の分布と自由度9のカイ二乗分布") curve(dchisq(x,9), add=TRUE, col="red")
- 信頼係数
,
F 分布
二つの母集団から抽出した二種の標本からの統計量が従う分布
等分散の検定
F統計量 ::
F 分布のグラフ
[copy]
curve(df(x,1,4),from=0, to=10, lty=1, col=1,main="自由度によって形が変るF分布") curve(df(x,5,28),from=0,to=10, lty=1, col=2, add=T) curve(df(x,28,6),from=0, to=10, lty=1, col=3, add=T) legend(2, 0.7, c("自由度=(1,4)", "自由度=(5,28)","自由度=(28,6"), lty=c(1,1,1), col=c(1,2,3))
[copy]
curve(df(x,20,1),from=0, to=4, lty=1,col=1) for (i in seq(2,20,2)) { curve(df(x,20,i),from=0, to=4, lty=1,col=1,add=T) }
確率密度関数
期待値 ::
分散 ::
5.4 特別なF値
F統計量 ::
標本不偏分散
分散の推定量
母分散が等しい場合は,
F と t の関係
標本サイズ n とし,統計量に n を明示し,