• このセクションで使っている R packages
library(broom)
library(tidyverse)
library(patchwork)
library(stargazer)

1. コントロール変数の選び方

  • 調査・観察データには交絡変数が含まれる
  • 交絡変数が含まれるとセレクションバイアスを引き起こす
  • セレクションバイアスがあると正しい因果効果を推定できない
    → 重回帰分析で因果推論するために必要な変数を慎重に決める必要がある
    → セレクションバイアスの原因となる交絡変数を見つけてコントロールする
  • その手段がバックドア基準

2. バックドア基準

  • 潜在的変数アプローチの考え方ではない
  • 回帰分析モデルに含める変数を決める際、構造的因果モデルで使われる基準
  • どの変数をコントロールすべきかわかる
  • そのために使うグラフ:有向非巡回グラフ (DAG: directed acyclic graph)
  • 疫学、統計学、経済学、政治学ごとに様々な用語で呼ばれるので注意が必要
記号 名称 内容 他の呼び方
\(X\) : 統制変数 (control variable) コントロール変数 = 交絡変数 (confounder)、共変量 (covariate)
\(D\) : 処置変数 (treatment) 原因 = 介入、刺激、暴露、独立変数、説明変数
\(Y\) : 結果変数 (outcome) 結果 = 応答変数、目的変数、従属変数

3. 交絡変数とバックドア経路

  • 有向非巡回グラフ (DAG) を描いて考えてみる
  • 「有効」(directed) とは一方から他方に向き(矢印)があるという意味
  • 双方向に影響している ↔︎ という関係は想定しない
  • 「非巡回」(acyclic) とはその矢印は変数の間をぐるりと「巡回しない」という意味
  • 「バックドア経路」とは「ある変数が処置変数 \(D\) と結果変数 \(Y\) の両方の原因となる経路」のこと