このセクションで理解すること✔「回帰関数」とは「説明変数で条件付けた結果変数
𝑌 の条件付き期待値」
✔ 観測値・予測値・残差の関係
✔ 回帰係数と因果効果の関係
✔ 重回帰分析で因果効果(平均処置効果:
ATE
)を推定する条件
expectation
)\[E[Y_i] = \int_{-∞}^{∞} yf(y)~dx\]
\(y\) がとりうる範囲全てにおいて積分することで求められる
\(Y_i\) が離散型確率変数のとき、\(Y\) の期待値 \(E[Yi]\) は
\[E[Y_i] = \sum_y yPr(Y_i =
y)\]
- 離散型確率変数の時は積分ではなく、和をとる
\[E[Y_i|X_i = x] = \int_{-∞}^{∞} yf(y|X_i = x)~dx\]
\[E[Y_i|X_i = x] = \sum_y yPr(Y_i = y|X_i = x)\]
例):年代によって高血圧者割合の平均値が変わる
年代 (\(X_i\)) | 高血圧者割合の期待値 (\(E[Y_i|X_i]\)) | 割合の程度 |
30s | \(E[Y_i|X_i = 30s]\) | 最も少ない |
40s | \(E[Y_i|X_i = 40s]\) | ・・・ |
50s | \(E[Y_i|X_i = 50s]\) | ・・・ |
60s | \(E[Y_i|X_i = 60s]\) | ・・・ |
70s | \(E[Y_i|X_i = 70s]\) | 最も多い |
ポイント✔ \(E[Y_i|X_i = x]\)は \(X\) の関数
\[E[E[Y_i|X_i]] = E[Y_i]\]
\[E[E[Y_i|X_i]] = E[\sum_y yPr(Y_i = y|X_i)]\\ = \sum_x[\sum_y yPr(Y_i = y|X_i=x)]Pr(X_i = x)\\ = \sum_x\sum_y yPr(Y_i = y|X_i=x)Pr(X_i = x)\\ = \sum_yy[\sum_xPr(Y_i = y|X_i=x)]\\ = \sum_yyPr(Y_i = y) = E(Y_i) \]
regression
)線形仮定
\(Y\) | : 結果変数 |
\(D\) | : 処置変数 |
\(X_1, X_2, X_3, ... X_k\) | : コントロール変数 |
\[p(Y|D, X_1, X_2, X_3, ... X_k) = f(D, X_1, X_2, X_3,...,X_k)\]
regress Y on D
)\[E[Y|D, X_1, X_2, X_3, ... X_k]\]
\[f[Y|D, X_1, X_2, X_3, ... X_k]\]
\[E[Y_i|D_i, X_{1i}, X_{2i}, X_{3i},..., X_{ki}] \\ = \alpha + \beta D_i + \gamma_1X_{1i} + \gamma_2X_{2i} + \gamma_3X_{3i} + ・・・+ \gamma_kX{ki}\]
simple regression
)regress Y on D
)\(Y\) | : 結果変数 |
\(D\) | : 処置変数 |
\[E[Y_i|D_i] = \alpha + \beta D_i\]
\[Y_i|D_i = E[Y_i|D_i] + (Y_i|D_i - E[Y_i|D_i])\]
→ 「観測値」\(Y_i|D_i\) は、回帰直線上の「予測値」\(E[Y_i|D_i]\)と「観測値」と「予測値のずれ」(=残差 \(e_i\))を足した値
\[e_i|D_i = Y_i|D_i - E[Y_i|D_i|\]
OLS
で推定すると残差の期待値(=平均値)はゼロ\[E[e_i] = 0\]
\[Cov(D_i, e_i) = E[D_i, e_i] = 0\]
\[Cov(D_i, e_i) = E[D_ie_i - E[D_i]E[e_i] \\ = E[D_ie_i] \]
\[e_i = Y_i |D_i - E[Y_i|D_i]\]
観測値・予測値・残差の関係線形を仮定しているので「観測値」\(Y_i|D_i\) 、「予測値」\(E[Y_i|D_i]\)、残差 \(e_i\) の関係は次のように表すことができる
\[Y_i|D_i = E[Y_i|D_i] + e_i\\ = \alpha + \beta D_i + e_i\]
\[Y_i|D_i = \alpha + \beta D_i + e_i\]
処置が二値変数の場合: \(D_i ∈ {0, 1}\)
処置 \(D_i\) の値が 0 の時
\[E[Y_i|D_i = 0] = E[\alpha + \beta ・0 +
e_i] \\
= E[\alpha ] + E[\beta ・0] + E[e_i] = \alpha \]
処置 \(D_i\) の値が 1 の時
\[E[Y_i|D_i = 1] = E[\alpha + \beta ・1 +
e_i]\\
= E[\alpha ] + E[\beta ・1] + E[e_i] = \alpha + \beta \]
条件付き期待値の差は
\[E[Y_i|D_i = 1] - E[Y_i|D_i = 0] = \beta \]
「回帰係数\(\beta\)とは(処置が二値変数の場合)処置 \(D\) の値が 0 から 1 に変わったとき、結果変数 \(Y\) の期待値がどれだけ増えたかを表す値
処置が二値変数ではない場合: \(D_i ∈ R\)
処置 \(D_i\) の値が小さい値
\(d\) の時
\[E[Y_i|D_i = d] = E[\alpha + \beta ・d +
e_i] \\
= E[\alpha ] + E[\beta ・d] + E[e_i] = \alpha + \beta
d\]
処置 \(D_i\) の値が大きい値
\(d+1\) の時
\[E[Y_i|D_i = d + 1] = E[\alpha + \beta
・(d+1) + e_i]\\
= E[\alpha ] + E[\beta ・(d+1)] + E[e_i] = \alpha + \beta d + \beta
\]
条件付き期待値の差は
\[E[Y_i|D_i = d+ 1] - E[Y_i|D_i = d] = \beta \]
::: {.kakomi-box11} 「回帰係数\(\beta\)とは(処置が二値変数でない場合)処置
\(D\) の値が 1 単位分増えた時、結果変数
\(Y\)
の期待値がどれだけ増えたかを表す値
::: - 実例は「17.
重回帰分析 1 (単回帰と重回帰)」を参照
\[Y_i|D_i = \alpha + \beta D_i + e_i\]
処置が二値変数の場合: \(D_i ∈ {0, 1}\)
\[E[Y_i|D_i = 0]\]
\[E[Y_i|D_i = 1]\]
潜在的結果 | |
\(E[Y_i(1)|D_i = 1]\) | \(D_i = 1\)の時の \(Y_i(1)\) の期待値 |
\(E[Y_i(0)|D_i = 0]\) | \(D_i = 0\)の時の \(Y_i(0)\) の期待値 |
\[\beta = E[Y_i|D_i = 1] - E[Y_i|D_i = 0]\\ = E[Y_i(1)|D_i = 1] - E[Y_i(0)|D_i = 0]\]
処置群と統制群の観察された期待値の差 \(\beta\)
は「因果効果(平均処置効果)」ATE
ではない
「通院する集団」(処置群)と「通院しない集団」(統制群)の事例で確認
回帰係数 \(\beta\)✔ \(\beta\)は因果効果=平均処置効果
ATE
ではない
✔ \(\beta\)は「処置群」と「統制群」の観測された平均値の差
\[E[Y_i(0)|D=1] = E[Y_i(0)|D=0]
ならば\] → セレクションバイアスは消える
→ ATE
(因果効果=平均処置効果)は推定できないが、ATT
(処置群における平均処置効果)が推定できる
ATE
)を計算できる\[\beta = E[Y_i(1)|D_i = 1] - E[Y_i(0)|D_i = 0]\\ = E[Y_i(1)] - E[YI(0)]\\ = ATE\]
因果効果(=平均処置効果 \(ATE\)) が推定できる条件✔
平均独立が成り立てば平均処置効果 (ATE
) が推定できる
✔ \(RCT\)
を施せば平均独立を満たすことができる
ATE
に関する詳細は次のサイトを参照して下さいmultiple regression
)\(Y\) | : 結果変数 |
\(D\) | : 処置変数 |
\(X\) | : コントロール変数 |
\[E[Y_i|D_i, X_i] = \alpha + \beta D_i + e_i\]
\[Y_|D_i, X_i = E[Y_i|D_i, X_i] + e_i = \alpha + \beta D_i + \gamma X_i + e_i\]
\[Y_i|D_i = \alpha + \beta D_i + \gamma X_i + e_i\]
処置が二値変数の場合: \(D_i ∈ {0, 1}\)
\[E[Y_i|D_i = 0, X_i = x] = E[\alpha + \beta ・0 + \gamma x + e_i] \\ = E[\alpha ] + E[\beta ・0] + E[\gamma x] + E[e_i] \\ = \alpha + \gamma x \]
処置 \(D_i\) の値が 1 の時
\[E[Y_i|D_i = 1, X_i = x] = E[\alpha + \beta
・1 + \gamma x + e_i] \\
= E[\alpha ] + E[\beta ・1] + E[\gamma x] + E[e_i] \\
= \alpha + \beta + \gamma x \]
条件付き期待値の差は
\[E[Y_i|D_i = 1, X_i = x] - E[Y_i|D_i = 0, X_i = x] = \beta \]
重回帰係数\(\beta\)とは(処置が二値変数の場合)確率変数 \(X\) の値がある実現値 \(x\) の時、処置 \(D\) の値が 0 から 1 に変わった 時、結果変数 \(Y\) の期待値がどれだけ増えたかを表す値
\[Y_i|D_i = \alpha + \beta D_i + \gamma X_i + e_i\]
\[\beta = E[Y_i|D_i = 1, X_i = x] - E[Y_i|D_i = 0, X_i =x]\\ = E[Y_i(1)| D_i = 1, X_i = x] - E[Y_i(0)|D_i = 0, X_i = x]\]
\(E[Y_i(1)|D_i = 1, X_i = x]\) | : \(D_i = 1\) の時(通院する時)に観測される潜在的結果 \(Y_i(1)\) の期待値 |
\(E[Y_i(0)|D_i = 0, X_i = x]\) | : \(D_i = 0\) の時(通院しない時)に観測される潜在的結果 \(Y_i(0)\) の期待値 |
\[E[Y_i(1)|D_i = 1, X_i = x] = E[Y_i(1)|D_i = 0, X_i = x]\]
\[and\]
\[E[Y_i(0)|, D_i = 1, X_i = x] = E[Y_i(0)|D_i = 0, X_i = x]\]
という二つの条件が成り立つなら、\(\beta\) が因果効果(平均処置効果: \(ATE\))になる
\[\beta = E[Y_i(1)| X_i = x] - E[Y_i(0)|D_i = x]\\ = E[Y_i(1) - Y_i(0)|X_i = x]\\ = ATE\]
重回帰係数\(\beta\)とは(処置が二値変数の場合)回帰係数 \(\beta\) は「\(X\) で条件づけた (\(X_i = x\)) 平均処置効果 (\(ATE\))」
重回帰分析で ATE を推定する条件1.
セレクションを生み出す変数を全て観測する
2. セレクションを生み出す変数を全て回帰式に含める