- このセクションで使っている
R packages
library(DT)
library(gapminder)
library(gghighlight)
library(ggrepel)
library(tidyverse)
library(stargazer)
このセクションで理解すること✔ RCT(ランダム化比較試験)とは何か?
✔ 「ランダム化」する理由は?
✔ 「ランダム化」によって何が解決できるのか?
✔ どうやって「ランダム化」するのか?
通院と健康状態の例 (Angrist and Pischke 2009) を使い、RCT を考える
確認したいこと:「病院行く」→「健康になる」
「通院(病院に行ったこと)」と「健康状態」の関係
データからわかる事実:
通院しなかった人の方が健康(健康状態の平均値:
3.21 < 3.93
)
→ 常識と反する結果!
なぜ通院すると健康でなくなるのか?
ここで想定する因果関係は「通院する」→「健康になる」
なぜ通院すると不健康になるのか?
【考えられる理由】:
(1) 病人から病気が感染してしまう
(2) 医療ミスのせいで健康を害する・・・等々
self-selection
)まとめ・ 調査・観察データを単純比較しても因果効果はわからない
その理由 → セレクションバイアスがあるから
・ セレクションバイアスがあると正しい因果効果が推定できない
ATE
)変数 | 変数名 | 詳細 |
目的変数 | Y |
: 健康状態 (1 = 最悪 〜 5 = 最良) |
説明変数 | D |
: 1 = 通院する、0 = 通院しない |
交絡変数 | h_hidden |
: もともとの健康状態 (1 = 最悪、2 = 悪い、3 = 普通、4 = 良い、5 = 最良) |
ATT
を計算できるATC
を計算できる→ 群間比較で因果効果 (ATE
) を推定できる
→ 赤色のセレクションバイアスが 0 であれば、ATT
が計算できるということ
→ 青色のセレクションバイアスが 0 であれば、ATC
が計算できるということ
→ 赤色と青色のセレクションバイアスが両方 0 であれば、ATE
が計算できる
\[E[Y_i(0)|D=1] - E[Y_i(0)|D=0]: 仮定1 → ATT が計算可能\]
\[E[Y_i(1)|D=1] = E[Y_i(1)|D=0]: 仮定2 → ATC が計算可能\]
ATE
) を推定できる (出典:Herman and Robins (2020)chapter
2 and 3)平均独立(2つの仮定)が同時に成り立つ時、群間比較で因果効果
(ATE
) を求めることができる
\[E[Y_i|D_i = 1] - E[Y_i|D_i =0]\\
= E[Y_i(1)|D_i = 1] - E[Y_i(0)|D_i = 0]\\
= E[Y_i(1)] - E[Y_i(0)]\\
= ATE\]
しかし、平均独立の式に「観察できないもの」 が含まれている
✔
「通院した集団の人々が、通院しなかった時の体調の期待値」:
\(E[Y_i(0)|D = 1]・・・仮定1\)
✔
「通院しなかった集団の人々が、通院した時の体調の期待値」:
\(E[Y_i(1)|D = 0]・・・仮定2\)
→ 仮定 1 が満たされれば ATT
が計算できる
→ 仮定 2 が満たされれば ATC
が計算できる
→ 仮定 1 と仮定 2 が両方満たされれば ATE
が計算できる
→ しかし、調査観察データではセレクションバイアスがあるため、両方の仮定を満たすことは難しい
→
平均独立はデータから確認できない
→ データによって平均独立を満たす 2
つの仮定を満たすことができない
→ 平均独立を満たすために「仮定すること」よりもっとよい方法がある
→ ランダム化
randomization
)
・・・セレクションバイアスを回避する解決策ATE
) を推定できる満たすべき条件 | |
独立 | 母集団において 2 群の分布が同じ |
平均独立 | 2 群の期待値が同じであれば、(分散などの)分布は異なっても良い |
exchangeability
) = 独立
(independence
)\[p(Y(0), Y(1) |D=1) = p(Y(0), Y(1)|D=0) \\ = p(Y(0), Y(1))\]
\(p(Y(0), Y(1))\) は \(Y(0)\) と \(Y(1)\) の同時確率
処置群 (D = 1) に割り付けたはずの固体全てに D = 0 を与え
統制群 (D = 0) に割り付けたはずの固体全てに D = 1
を与えても
当初の予定通り処置を与えた場合と同じ結果が得られる
例)「通院する集団」と「通院しない集団」の構成メンバーをまるっと入れ替えても、同じ結果が得られるということ
処置群と統制群は「群として」は同じ
処置群と統制群を交換しても問題はない
処置群と統制群が交換可能であれば
→ その処置 D は外生変数 (exogenous
variable)
潜在的変数の組 \(\{Y(0), Y(1)\}\) と独立な処置 D は外生性をもつ
1 度だけ RCT を実行しても、独立性は保証されない
例)コイントスをして「通院する集団」と「通院しない集団」を決めても
→ 不健康な人ばかり「通院する」に割り当てられ
→ 健康な人は「通院しない」に割り当てられることが偶然に起こりうる
→ この場合、処置群と統制群は交換可能ではない
→ しかし、RCT を何度も繰り返す
→ 平均的には 2 群が交換可能になる
→ ランダム化による独立性が満たされる
✔
1、2回だけの実験で群が交換可能である保証はない
大数(たいすう)の法則
= ランダムな試行が信頼に足る結果を示す保証の一つ
標本のサイズ N が大きくなるほど
→ 標本平均は母集団に近づく
被験者の数(=標本サイズ N)が十分大き
→ 各群の平均値は母平均に十分近いはず
ランダム化
→ 2 群の母集団分布と母平均は同じになる
被験者の数が十分大きければ
→ 平均独立は満たされる
十分大きいとは?
必要な標本サイズの大きさは、問題によって異なる
大きな処置効果を識別したい
→ 比較的小さい N のサイズで十分
小さな処置効果を識別したい
→ 比較的大きな N のサイズが必要
検出力分析 (power analysis
)
→ 標本サイズを決める
検出力の詳細に関しては次の本の 2 章を参照されたい
Peter G. Moffatt (2018)『経済学のための実験統計学』勁草書房
バランスチェックの問題点:
測定できない変数のバランスはわからない
例)もともとの健康状態、個人の本来の能力など
私たちが知りたいのは「 2
群間で違いがないこと」=「バランスしていること」
→ しかし、検定で積極的に示せるのは「バランスしていないこと(2
群間で違いがあること)」
RCT
の方法RCT
の目的:Bernoulli trial for each unit
例)
2^100
[1] 1.267651e+30
\[2^{100} ≈ 1.27 ・ 10^{30}\]
→ 膨大な数の組み合わせになってしまう
completely randomized experiment
choose(100, 50)
[1] 1.008913e+29
\[_{100}C_{50} ≈ 1.01・10^{29}\]
→ 膨大な数の組み合わせになってしまう
stratified randomized experiment
あらかじめ決めた各ブロック内で、完全ランダム化実験を行う
全体の平均処置効果 (ATE)
は、ブロックサイズに重みにした加重平均
→ 全体に占めるブロックの比率を重みにする
自然科学では分析対象が「均質」(化学における分子や物理における材料など)
しかし、社会科学における研究対象である固体は「均質」ではない
→ できるだけ同質的な固体ブロック(あるいは層)を作り
→ ブロック内でランダム化するのが良い
ブロッキング (blocking)
ブロッキングの一例
→ 男女比にばらつきが出る → 性別による差が生じてしまう
→ この状況は交換可能ではない(=グループを入れ替えられない)
→ 平均因果効果 (ATE
) を推定できない
✔ 解決方法:
choose(50, 25)*choose(50, 25)
[1] 1.597964e+28
\[_{50}C_{25}・_{50}C_{25} = 1.6・10^{28}\]
paired randomized experiment
できるだけ同質のペアに分ける
→ 各ペア内でランダムに選んだ一方を「処置群」にする
→ 一つ一つのブロックの大きさが 2
→ 最も似ている個人二人をペアにする
→ 交換可能性が成り立ちやすい
100人の被験者を「ペアごとランダム化実験」で割り付けた時のパタン数を
R で計算してみる
100人の被験者の中で50個の同質のペアを作る
その50個のペアからランダムに一方を「処置群」に割り当てる訳だから
2^50
[1] 1.1259e+15
ランダム化の方法 | パタン数 |
ベルヌーイ実験 | \(2^{100} ≈ 1.27 ・ 10^{30}\) |
完全ランダム化実験 | \(_{100}C_{50} ≈ 1.01・10^{29}\) |
ブロック別(層別)ランダム化実験 | \(_{50}C_{25}・_{50}C_{25} = 1.6・10^{28}\) |
ペアごとランダム化実験 | \(2^{50} ≈ 1.13 ・ 10^{15}\) |
・処置の割り付けパタンが最も多いのは「ベルヌーイ実験」
・処置の割り付けパタンが最も少ないのは「ペアごとランダム化実験」
→「ペアごとランダム化実験」による固定効果の推定が最も精度が高い
・RCTとは「処置をランダムに割り付け、平均処置効果を推定する方法」
・RCTを使えば、セレクションバイアスを取り除くことができる
・1回の実験で平均処置効果が正しく推定できるとは限らない]
・標本サイズを大きくすると推定精度を上げることが可能(大数の法則より)
・ランダム化の方法は様々あるが、ブロッキングするのがよい