- このセクションで使っている
R packages
library(broom)
library(tidyverse)
library(patchwork)
library(stargazer)
なぜバイアスが問題なのか?
- バイアスが存在すると、
OLS
などのパラメータ推定値が真の値からずれてしまう
- ここでは、重回帰分析における変数選択に関連して、次の 3
つのケースを考える
✔ 必要な説明変数を含めない時 |
推定値にバイアスが生じる → 深刻 |
脱落変数バイアス (OVB) |
✔ 入れるべきでない変数を含めた時 |
推定値にバイアスが生じる → 深刻 |
処置後変数バイアス |
✔ 無関係な変数を含めた時 |
無益だが有害ではない |
|
|
|
|
- ここではこれら 3 つのケースを事例を交えながら解説する
1. 平均処置効果 \(ATE\)
が推定できる条件
\(Y\) |
: 結果変数(健康状態) |
\(D\) |
: 処置変数(0: 通院しない、1: 通院する) |
\(e\) |
: 残差 |
|
|
- 処置 \(D\) 以外に結果 \(Y\) に影響を与える変数が一切ない
→ 処置 \(D\) と残差 \(u\) の共分散がゼロ : \(Cov(D_i, e_i) = 0\)
→ 処置変数 \(D\) と残差 \(e\) が独立(=両者は無関係)
→ 因果効果 \(\beta\) を推定できる