R パッケージ
一覧descriptive statistics
)
と推測統計学 (inferential statistics
)
の二つに分類できる統計学の種類 | 特徴 |
---|---|
記述統計学: | 統計量を使ってデータ傾向や性質をつかむ |
推測統計学: | 母集団の母数(母平均や母分散)を検定し推定する |
population
) から標本 (sample
)
を無作為に抽出し、その標本によって得られた標本平均や不偏分散などの統計量を使って、母集団の母数(母平均や母分散)を検定し推定する → ここでは「統計的推定」と「仮説検定」を解説する
母数と統計量:
推測統統計学では、母数 (parameter
) と統計量
(statistic
) とを明確に区別しているので注意が必要
母数(パラメタ)
population mean
population ratio
population variance
population standard deviation
標本統計量
sample mean
sample ratio
sample variance
unbiased variance
sample variance
unbiased standard deviation
統計的推定の方法
・標本から標本統計量(標本平均など)を計算する
→ 母集団の母数(母平均など)を推定する
統計的推定をする際の仮定
・多くの場合、母集団は正規分布していると仮定
・しかし、中心極限定理のおかげで、母集団が正規分布でなくても t
分布で推定可能
具体的な値を用いて「母集団の平均値は○○くらいだろう」と予想すること
母集団の分布 | 母分散 \(\sigma^2\) | 対処法 |
正規分布 | 既知 | 母分散 \(\sigma^2\) を使う |
正規分布 | 未知 | 不偏分散を使う・t分布を使う |
不明 | 未知 | 不偏分散を使う・t分布を使う・標本を沢山集める |
標本平均 \(\bar{X}\)
(エックス・バーと読む)を計算する
\[\bar{X} = \frac{X_1 + X_2 + X_3 +
・・・X_n}{n}\]
\(X_1, X_2,...\)
などは、無作為に選ばれる
→ どの数が選ばれるかわからないから「確率変数」だといえる
\(\bar{X}\) は確率変数 (\(X_1, X_2,...\))
の「和」だから「確率変数」
標本平均 \(\bar{X}\)
は「確率変数」なので大文字で表記
(「小文字の \(x\)
は具体的な観測地を表す」)
\[U^2= \frac{(X_1-\bar{X}) + (X_2-\bar{X}) + ・・・(X_n-\bar{X})}{n-1}\]
点推定で「標本分散」でなく「不偏分散」を使う理由①
・「標本分散 \(S^2\)」では「真の分散 \(\sigma^2\)」 を過小評価してしまうから
・標本分散 \(S^2\)
の期待値を式で表してみる
\[E[S^2] = \sigma^2 - \frac{1}{n}\sigma^2\]
・標本分散 \(S^2\) は真の分散 \(\sigma^2\) を \(\frac{1}{n}\)
だけ過小評価していることがわかる
・\(n\)
の数が大きくなるほど、過小評価する度合いは小さくなる
・上の式を書き換えてみる
\[E[S^2] = \sigma^2 - \frac{1}{n}\sigma^2 = \frac{n-1}{n}\sigma^2\]
\[E[S^2] = \frac{n-1}{n}\sigma^2\]
・この標本分散 \(S^2\) の期待値が真の分散 \(\sigma^2\) に等しくなるためには \(E[S^2]\) に \(\frac{n}{n-1}\) をかければ良い
・標本分散 \(S^2\) を表す式は次のとおり
\[S^2= \frac{X_1 + X_2 + X_3 + ・・・X_n}{n}\]
・両辺に \(\frac{n}{n-1}\) をかけてみる
\[\frac{n}{n-1}・S^2= \frac{(X_1-\bar{X}) + (X_2-\bar{X}) + ・・・(X_n-\bar{X})}{n}・\frac{n}{n-1}\\ = \frac{(X_1-\bar{X}) + (X_2-\bar{X}) + ・・・(X_n-\bar{X})}{n-1} \\=U^2\]
・これは不偏分散 \(U^2\)
を表す式と一致する
→ 不偏分散の期待値は
\[E[U^2] = \sigma^2\]
点推定で「標本分散」でなく「不偏分散」を使う理由②
・ここでは母集団の母平均が未知 (\(\mu =
?\)) である場合に母分散 \(\sigma\) の点推定している
・\(x_1, x_2, x_3\) という 3
つの観測値を入手したとする
・標本分散は \(x_1, x_2, x_3\)
という 3 つの観測値の平均値 \(\bar{x}\)
とそれぞれの観測値の差の二乗の和として計算される
・真の母分散 \(\sigma^2\)
を推定したいのであれば、本来なら、母平均 \(\mu\) を使って標本分散を計算すべき
・しかし、母集団の母平均が未知 (\(\mu\))なので、標本から得られた標本平均
\(\bar{x}\) を使っている
・得られた標本から計算された平均値と個別観測値との差を使っている
→ 真の母平均 \(\mu\)
と個別観測値との差と比較すれば
→ 得られた標本から計算された平均値と個別観測値との差の方が小さくなる
\[S^2= \frac{(X_1-\bar{X}) + (X_2-\bar{X}) + ・・・(X_n-\bar{X})}{n}\]
・標本分散は \(x_1, x_2, x_3\)
という 3 つの観測値の平均値 \(\bar{x}\)
の代わりに、母平均 \(\mu\)
の値とそれぞれの観測値の差の二乗の和として計算される
- 次の式を使って標本平均 \(S^2\)
を計算できる
\[S^2= \frac{(X_1-\mu) + (X_2-\mu) + ・・・(X_n-\mu)}{n}\]
・点推定をする上で、真の母平均 \(\mu\) を使った場合と、その代用として 3 つの観測値の平均値 \(\bar{x}\) を使った場合では、観測値の平均値 \(\bar{x}\) を使った場合の方が、標本分散の値が小さい
1 個の標本をとる場合 | → 標本自体の分布を考える |
複数の標本をとる場合 | → 標本平均の分布を考える |
確率は面積に対応するので、グラフと横軸で挟まれた部分の面積 = 1 (=
100%)
\(μ\) から標準偏差 (\(σ\)) の 1.96倍だけ(= 1.96\(σ\))左右に離れると →
95%の面積を占める
この母集団から標本 (\(X\)) を 1
個だけ抽出する
その \(X\)
の値が濃い灰色の面積内にある確率は 95%
→ 95%の確率で次の不等式が成り立つ \[μ−1.96σ
≦ X ≦ μ+1.96σ\]
この式を \(μ\)
についてとく
\[X−1.96σ ≦ μ ≦ X
+1.96σ\]
この母集団から抽出された標本 (X) が 160 cm だとする
X = 160, σ = 8 を代入
\[144.32 ≦ μ ≦ 175.68\]
標本を 2 個とってみる
母平均 \(\mu\)
の少しだけ左側から標本をとった場合
→ 95%信頼区間は母平均 \(\mu\)
を含む
母平均 \(\mu\)
の少しだけ右側から標本をとった場合
→ 95%信頼区間は母平均 \(\mu\)
を含む
「95% 信頼区間」と聞くと「私たちが知りたい母数の値がこの区間に含まれている確率が
95%」と思うかもしれない
しかし、それは 誤り
区間の中に母数があれば、その信頼区間が母数を含んでいる確率は
100%
区間の中に母数がなければ、その信頼区間が母数を含んでいる確率は0%
一つの信頼区間は母数を「含むか」「含まないか」のいずれか
母数の「真の値(定数)」の存在が想定される限り、私たちがその値を知らなくともこの事実に変わりはない
つまり、ある 95% 信頼区間が推定したい母数を捉えている確率が 95%
ということはあり得ない
→ 確率は 100%(うまいこと母数を捉えている)か
0%(母数を捉え損なっている)かのどちらか
それぞれの標本について 95% 信頼区間を求める
求めた95%信頼区間のうち、95% の区間は真の母数を区間の中に捉え、残りの 5%は母数を捉え損ねる
95%信頼区間を理解するためのポイント
・抽出する値ごとに95%信頼区間(=横棒)はたくさんできる
・たくさんできる信頼区間のうち、95%が母平均 \(\mu\) を含む
→ 5%は母平均を捉え損ねる
正規分布の性質
[1] 168.5
\[μ−1.96\frac{\sigma}{\sqrt{n}}≦ \bar{X} ≦ μ+ 1.96\frac{\sigma}{\sqrt{n}}\]
μ で解くと
\[\bar{X}−1.96\frac{\sigma}{\sqrt{n}}≦ \mu ≦
\bar{X} + 1.96\frac{\sigma}{\sqrt{n}}\]
この式に \(\bar{X} = 168.5\)、\(n = 9\)、\(\sigma = 8\)を代入すると
\[168.5−1.96\frac{8}{\sqrt{9}}≦ \mu ≦ 168.5+ 1.96\frac{8}{\sqrt{9}}\\ = 168.5-5.23≦ \mu ≦ 168.5 + 3.23\\ = 163.3 ≦ \mu ≦ 173.7\]
区間推定のポイント ・より多くの標本をとることによって、より正確な(より幅の狭い)区間推定ができる
・標本自体の分布ではなく、標本平均の分布を使って推定したため
・標本平均の分布の方がよりシャープな(つまり、分散が小さい)分布だから
\[\bar{X}−1.96\frac{\sigma}{\sqrt{n}}≦ \mu ≦ \bar{X} + 1.96\frac{\sigma}{\sqrt{n}}\]
母分散 \(\sigma^2\) が未知の場合に区間推定できない理由
・期待値と分散の性質
・確率変数を \(a\) 倍して \(b\) を足す → 定数 \(b\) は外にでて、確率変数だけの期待値になる
\[E[aX + b] = aE[X] + b\]
・確率変数を \(a\) 倍して \(b\) を足す → 定数 \(a\) は二乗されて外にでる
\[V[aX + b] = a^2V[X]\]
分散の定義 \[V[X] = E[X-E[X])^2]\\ = E[X^2]-E[X]^2\]
・\(\bar{X}\)の平均は \(\mu\)
・\(\bar{X}\)の分散は \(\frac{\sigma^2}{n}\)
\(\bar{X}\) | 標準化 | |
---|---|---|
平均 | \(\mu\) | 0 |
分散 | \(\frac{\sigma^2}{n}\) | 1 |
・確率変数 \(Z\) は標準正規分布に従う
→ 標準正規分布の平均は 0、分散は 1
\[Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}\]
\[−1.96 ≦
\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} ≦ 1.96\]
・\(\mu\) について整理すると
\[\bar{X}−1.96\frac{\sigma}{\sqrt{n}}≦ \mu
≦ \bar{X}+1.96\frac{\sigma}{\sqrt{n}}\]
・信頼度95%の信頼区間が得られた
・しかし、これは母分散 \(\sigma^2\)
がわかる時しか使えない
\[Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}\]
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}}\]
定理 ・平均 \(\mu\)、分散 \(\sigma^2\) の正規分布に従う独立な確率変数
\(X_1, X_2,... X_n\) があるとする
このとき、
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}}\]
は自由度 \(n-1\) の \(t\) 分布に従う
信頼度95%で母集団(拓大生の TOEFL ITPスコアー) \(μ\) を区間推定する
サンプル数は n = 4 だから、自由度 4-1 = 3 の t 分布に従う
下の表の「自由度 = 3」と「0.025」が交差する数字「3.182」が信頼度95%(= 有意水準 5%)の閾値値
\[−3.182 ≦ \frac{\bar{X}-\mu}{\frac{U}{\sqrt{n}}} ≦ 3.182\]
この式に代入する値を計算してみる
標本平均 \(\bar{X}\)を計算する
\[\bar{X} = \frac{500 + 450 + 623 + 400}{4} = 493.25\]
不偏分散 \(U^2\)
を計算する
\[U^2 = \frac{(x_1-\bar{x})^2 + .. +
(x_n-\bar{x})^2}{n-1}\\
= \frac{(500-493.25)^2 + .. + (400-493.25)^2}{4-1}
= 9149\]
不偏標準偏差 \(U =\sqrt{U^2}\)
なので U = 95.7
以上の値を下の式に代入してみる
\[= 493.25−3.182\frac{95.7}{\sqrt{4}}≦ \mu ≦ 493.25+3.182\frac{95.7}{\sqrt{4}}\\ = 493.25−152.3≦ \mu ≦ 493.25+152.3\\ = 341 ≦ \mu ≦ 645\]
One Sample t-test
data: toefl
t = 10.314, df = 3, p-value = 0.001944
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
341.0496 645.4504
sample estimates:
mean of x
493.25
t.test(toefl, mu = 0)
と同じ意味→ 上の手計算で求めた値と一致する
参考(推定から検定へ)
・ここで「得られた4つのサンプルから、母平均 \(\mu\) は342なのかどうかを検定したい時」には、RStudio に次のように打ち込んで実行する
One Sample t-test
data: toefl
t = 3.1626, df = 3, p-value = 0.05077
alternative hypothesis: true mean is not equal to 342
95 percent confidence interval:
341.0496 645.4504
sample estimates:
mean of x
493.25
p-value = 0.05077
で0.05より大きい・ここで「得られた4つのサンプルから、母平均 \(\mu\) は340なのかどうかを検定したい時」には、RStudio に次のように打ち込んで実行する
One Sample t-test
data: toefl
t = 3.2044, df = 3, p-value = 0.04917
alternative hypothesis: true mean is not equal to 340
95 percent confidence interval:
341.0496 645.4504
sample estimates:
mean of x
493.25
p-value = 0.04917
で0.05より小さいCLT: Central Limit Theorem
)
とは、母集団が正規分布していなくても「標本サイズ(サンプルサイズ)が大きくなれば、標本平均は正規分布で近似できる」という定理Normal Distribution
)「平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布」
様々な分布を正規分布に見立てると、その内容の範囲を確率的に予想することが可能になる
ここでは R を使ってシミュレーションを実行し、中心極限定理の信憑性を「実感」してみよう
中心極限定理のシミュレーション
標本サイズが大きくなると、標本平均は近似的に正規分布に従うのか?
バックに入れた10枚のカードを使ったシミュレーション
bag <- 0:9 # 人工的に 0 から 9 までのカードを作成
exp_1 <- sample(bag, # カードが入っている bag を使う
size = 2, # 引くカードは 2 枚と指定(標本サイズ N = 2)
replace = TRUE) # 取り出したカードは元に戻すと指定
mean(exp_1) # 平均値を計算して表示
[1] 3
実験をやる度に異なる平均値が得られる(何回か試して下さい)
この実験を 1,000 回繰り返してみよう
「それぞれの回で得られた平均値の分布」はどんな形か確かめる
R
で同じ作業を繰り返し行う簡単な方法は、for ループ
を使う
for ループの使い方:
例えば、0 からスタートして「10を足す」という作業を 5 回繰り返すには、次のようにする
まず、スタート時の数である 0 を作成し、保存する
result
という名前の入れ物を用意するresult
の中身を確認してみる[1] NA NA NA NA NA
forループ
を使って、数を 10 だけ加える作業を 5
回繰り返してみるfor
の直後の丸カッコ ( )
の中に繰り返し回数を指定し、ループさせる内容を中括弧 \(\{ \}\) で囲むfor(i in 1:5){ # i が 1 から 5 まで繰り返すという意味
A <- A + 10 # A に 10 を足す
result[i] <- A # i 番目の作業(=足し算)の結果を result[i] に入れる
}
result # 入れ物の中身を確認
[1] 10 20 30 40 50
→入れ物 (result
) の中に想定どおりの数値 (0
からスタートして 10ずつ足した数) が入っていることがわかる
sim1: 標本サイズ = 2, 繰り返し回数 = 10
for ループ
を利用して、皆さんが授業の実習で実施したように、カードを
2 回引く作業を 10 回繰り返し、結果を可視化してみるbag <- 0:9 # 人工的にカードを作成
N <- 2 # 標本サイズ(カードを 2 枚選ぶ)
trials <- 10 # 実験の繰り返し回数 = 10
sim1 <- rep(NA, length.out = trials) # 結果の保存容器
for (i in 1:trials) {
experiment <- sample(bag,
size = N,
replace = TRUE) # 復元抽出
sim1[i] <- mean(experiment) # i 回目の平均値を保存
}
df_sim1 <- tibble(avg = sim1)
h_sim1 <- ggplot(df_sim1, aes(x = avg)) +
geom_histogram(binwidth = 1,
boundary = 0.5,
color = "black") +
labs(x = "2枚のカードの平均値",
y = "度数") +
ggtitle("SIM1: N = 2, 繰返回数 = 10") +
scale_x_continuous(breaks = 0:9) +
geom_vline(xintercept = mean(df_sim1$avg), # 平均値に縦線を引く
col = "lightgreen") +
theme_bw(base_size = 14,base_family = "HiraKakuPro-W3") # 文字化けしないためのコマンド(マックユーザのみ)
plot(h_sim1) # 結果を可視化して表示
# A tibble: 10 × 1
avg
<dbl>
1 8
2 7.5
3 5.5
4 4
5 6
6 2
7 6
8 2.5
9 4.5
10 7
[1] 5.3
sim2: 標本サイズ = 5, 繰り返し回数 = 100
bag <- 0:9 # 人工的にカードを作成
N <- 5 # 標本サイズ(カードを 5 枚選ぶ)
trials <- 100 # 実験の繰り返し回数 = 100
sim2 <- rep(NA, length.out = trials) # 結果の保存容器
for (i in 1:trials) {
experiment <- sample(bag,
size = N,
replace = TRUE) # 復元抽出
sim2[i] <- mean(experiment) # i 回目の平均値を保存
}
df_sim2 <- tibble(avg = sim2)
h_sim2 <- ggplot(df_sim2, aes(x = avg)) +
geom_histogram(binwidth = 1,
boundary = 0.5,
color = "black") +
labs(x = "5 枚のカードの平均値",
y = "度数") +
ggtitle("SIM2: N = 5, 繰返回数 = 100") +
scale_x_continuous(breaks = 0:9) +
geom_vline(xintercept = mean(df_sim2$avg), # 平均値に縦線を引く
col = "lightgreen") +
theme_bw(base_size = 14,base_family = "HiraKakuPro-W3")
plot(h_sim2)
# A tibble: 100 × 1
avg
<dbl>
1 5
2 4
3 5.2
4 3.2
5 5.4
6 5.6
7 3.8
8 4.4
9 3.6
10 4.4
# ℹ 90 more rows
[1] 4.538
sim3: 標本サイズ = 100, 繰り返し回数 = 1000
bag <- 0:9 # 人工的にカードを作成
N <- 100 # 標本サイズ(カードを 100 枚選ぶ)
trials <- 1000 # 実験の繰り返し回数
sim3 <- rep(NA, length.out = trials) # 結果の保存容器
for (i in 1:trials) {
experiment <- sample(bag, size = N, replace = TRUE) # 復元抽出
sim3[i] <- mean(experiment) # i 回目の平均値を保存
}
df_sim3 <- tibble(avg = sim3)
h_sim3 <- ggplot(df_sim3, aes(x = avg)) +
geom_histogram(binwidth = 0.125,
color = "black") +
labs(x = "100枚のカードの平均値", y = "度数")+
ggtitle("SIM3: N = 100, 繰返回数 = 1000") +
scale_x_continuous(breaks = 0:9) +
geom_vline(xintercept = mean(df_sim3$avg), # 平均値に縦線を引く
col = "lightgreen") +
theme_bw(base_size = 14,base_family = "HiraKakuPro-W3")
plot(h_sim3)
# A tibble: 1,000 × 1
avg
<dbl>
1 4.29
2 4.45
3 4.77
4 4.48
5 4.62
6 4.98
7 4.56
8 4.91
9 4.62
10 4.65
# ℹ 990 more rows
[1] 4.49537
まとめ ・元になる母集の分布は一様分布でも、サンプルサイズ N を増やすと「平均値の分布」は正規分布に近づく
→サンプルサイズ N が十分大きい(大まかな目安はN >100
)とき、正規分布を使って統計的推定や検定を行うことが許される
ベルヌーイ分布とは ・「当選か落選か」「表か裏か」「合格か不合格か」のように2種類のみの結果しか得られないような実験や試行(ベルヌーイ試行)の結果を0と1で表した分布
・1である確率が \(p\) であるとき、0である確率は \(1-p\) となるシンプルな確率分布
・\(k\)・・・成功か失敗を表すパラメータ(1は成功、0は失敗を表す)
・\(p\)・・・成功確率
\[E(X) =\sum kP(X = k) = p\]
\[V(X) = E(X^2)-(E(X))^2\\ = p(1-p)\]
\[p−1.96\sqrt{\frac{p(1-p)}{n}}≦ \bar{X} ≦ p+ 1.96\sqrt{\frac{p(1-p)}{n}}\]
\[R−1.96\sqrt{\frac{p(1-p)}{n}}≦ p≦ R+ 1.96\sqrt{\frac{p(1-p)}{n}}\]
→ \(p\) を評価できる形にし、式を変形できる
大数の法則 ・独立で同じ分布からなる確率変数の標本平均は母平均に収束する
\[R−1.96\sqrt{\frac{p(1-p)}{n}}≦ p≦ R+ 1.96\sqrt{\frac{p(1-p)}{n}}\]
\[R−1.96\sqrt{\frac{R(1-R)}{n}}≦ p≦ R+ 1.96\sqrt{\frac{R(1-R)}{n}}\] → 95%信頼区間
Q:
早稲田大学で無作為に100人の学生に「現政権を支持しているか?」と聞いたところ、75人が「支持する」と回答した
早大生の政権支持率を信頼度95%で推定しなさい
A:
100人中75人は 0.75 に相当なので標本比率 \(R=0.75\) は
n = 100 とここで得られた \(R=0.75\) を下の式に代入する
\[R−1.96\sqrt{\frac{R(1-R)}{n}}≦ p≦ R+ 1.96\sqrt{\frac{R(1-R)}{n}}\]
\[0.75-1.96\sqrt{\frac{0.75*0.25}{100}}≦
p≦ 0.75+1.96\sqrt{\frac{0.75*0.25}{100}}\]
\[0.69≦ p≦ 0.91\]
カイ二乗 \(\chi^2\) の定理 ・分散 \(\sigma^2\) の正規分布に従う独立な確率変数
\(X_1, X_2,..., X_n\)
があるとする
・このとき
\[T =
\frac{(n-1)U^2}{\sigma^2}\]
は自由度 \(n-1\) の \(\chi^2\) 分布に従う
・\(U\): 不偏分散
・\(\sigma^2\): 母分散
・n 個の標本を抽出
・\(T\) の確率変数が\(\chi^2\) 分布に従う
・式の右辺は \(U\) だけが確率変数
→ \(T\) が自由度 \(n-1\) の\(\chi^2\) 分布に従う
→ 不偏分散 \(U\) が従う形が自由度
\(n-1\) の\(\chi^2\) 分布
\[T = \frac{(n-1)U^2}{\sigma^2}\]
\[T = (\frac{X_1-\bar{X}}{\sigma})^2 + (\frac{X_2-\bar{X}}{\sigma})^2 +...+ (\frac{X_n-\bar{X}}{\sigma})^2\]
\(T\) が表しているもの ・それぞれの標本 \(X_1, X_2,..., X_n\) が、標本平均 \(\bar{X}\) からどれくらいずれているかの合計
\[T = (\frac{X_1-\bar{X}}{\sigma})^2 +
(\frac{X_2-\bar{X}}{\sigma})^2
+...+ (\frac{X_n-\bar{X}}{\sigma})^2\]
\[= \frac{n-1}{\sigma^2}\frac{(X_1-\bar{X})^2
+ (X_2-\bar{X})^2 + (X_n-\bar{X})^2}{n-1}\]
・上の式の右半分である \(\frac{(X_1-\bar{X})^2 + (X_2-\bar{X})^2 + (X_n-\bar{X})^2}{n-1}\) は不偏分散 \(U^2\) なので
\[= \frac{(n-1)U^2}{\sigma^2}\]
→ 標本平均と標本の値のずれは小さい
→ t の値は小さい
→ 標本平均と標本の値のずれは大きい
→ t の値は大きい
\(T\) という確率変数が表しているもの (=カイ2乗値: \(\chi^2\)) ・それぞれの標本 \(X_1, X_2,..., X_n\) が、標本平均 \(\bar{X}\) からどれくらいずれているかの合計(=カイ2乗値: \(\chi^2\))
\[T = \frac{(n-1)U^2}{\sigma^2}\]
\[2.7 ≦ \frac{(n-1)U^2}{\sigma^2}≦ 19.2\]
\[\frac{(n-1)U^2}{19.2}≦ \sigma^2 ≦ \frac{(n-1)U^2}{2.7}\]
\[\frac{82.8}{19.2}≦ \sigma^2 ≦ \frac{82.8}{2.7}\] \[4.3 ≦ \sigma^2 ≦ 30.7\]
母集団に関する仮説を、標本から得た情報に基づき検証すること
\(H_1\):母平均は
300点ではない・・・自分が主張したい仮説
→ \(\mu < 300\) もしくは \(\mu > 300\)
→ 両側検定
0.05 = 5%
定理 ・平均 \(\mu\)、分散 \(\sigma^2\) の正規分布に従う独立な確率変数
\(X_1, X_2,... X_n\) があるとする
このとき、
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}}\]
は自由度 \(n-1\) の \(t\) 分布に従う
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}} = \frac{493.3-300}{\frac{95.3}{\sqrt{4}}}= \frac{193.3}{47.65}=4.06\]
・棄却域にある → 帰無仮説を棄却し、対抗仮説を受け入れる
・棄却域にない → 帰無仮説を棄却できない → 何もいえない
→ 帰無仮説「\(H_0:\) 母平均は
300点」を棄却
→ 対抗仮説を受け入れる「母平均は 300点以上」(平均点が493点だから)
→ 帰無仮説を棄却できず
Rを使って確認(両側検定)
One Sample t-test
data: test
t = 4.0408, df = 3, p-value = 0.02727
alternative hypothesis: true mean is not equal to 300
95 percent confidence interval:
341.0496 645.4504
sample estimates:
mean of x
493.25
→ ここで得られた p値 = 0.02727.
→ 帰無仮説:「母平均は300点」は棄却.
→ 母平均は300点以上(標本平均が493点だから)
\(H_0\):母平均は300点以下・・・否定したい仮説
→ \(\mu < 300\)
\(H_1\):母平均は
300点以上・・・自分が主張したい仮説
→ \(\mu > 300\)
→ 片側検定
定理 ・平均 \(\mu\)、分散 \(\sigma^2\) の正規分布に従う独立な確率変数
\(X_1, X_2,... X_n\) があるとする
このとき、
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}}\]
は自由度 \(n-1\) の \(t\) 分布に従う
\[T = \frac{\bar{X} - \mu}{\frac{U}{\sqrt{n}}} = \frac{493.3-300}{\frac{95.3}{\sqrt{4}}}= \frac{193.3}{47.65}=4.06\]
標本から得られた t 値 (4.06) が棄却域 (2.353以上) にある
→ 帰無仮説「\(H_0:\) 母平均は
300点以下」を棄却
→ 対抗仮説を受け入れる「母平均は
300点以上」(平均点が493点だから)
標本から得られた t 値が棄却域にない場合
→ 帰無仮説を棄却できず
Rを使って確認(片側検定)
One Sample t-test
data: test
t = 4.0408, df = 3, p-value = 0.01364
alternative hypothesis: true mean is greater than 300
95 percent confidence interval:
380.7004 Inf
sample estimates:
mean of x
493.25
→ ここで得られた p値 = 0.01364.
→ 帰無仮説:「母平均は300点以下」は棄却.
→ 母平均は300点以上