傾向マッチング(Propensity Score Matching, PSM)とは、観察データを用いて因果推論を行うための手法である。ランダム化比較試験(RCT)のような実験デザインができない場合に、対象群と比較群の間で共変量のバランスを取ることで、処置(治療や介入)の効果を推定するために用いられる。
基本的な流れ
- 傾向スコアの推定
傾向スコアは、ある個体が特定の処置を受ける確率を表す。これはロジスティック回帰などを使って、共変量を基に処置群(介入を受けた群)と非処置群(介入を受けなかった群)を予測することで算出される。 - マッチングの実施
傾向スコアが推定された後、処置群と非処置群の個体をマッチングする。この際、以下のようなマッチング方法が使用される:- 1対1マッチング:処置群の個体に対して、最も近い傾向スコアを持つ非処置群の個体を一つ選んでマッチングする。
- カリパーマッチング:傾向スコアの差がある一定の範囲(カリパー)以内の個体だけをマッチングする。
- 多対多マッチング:一つの処置群に対して複数の非処置群を対応させるか、その逆を行う。
- バランスの確認
マッチング後に、処置群と非処置群の間で共変量のバランスが取れているかどうかを確認する。これは、標準化平均差(Standardized Mean Differences)や他の統計指標を使って行われる。 - 効果の推定
マッチングが完了した後、処置の効果を推定する。この時点で、RCTと同様に処置群と非処置群のアウトカムの差を比較することで、因果推論が可能となる。
PSMの利点と限界
利点:
- ランダム化が難しい観察データでも、処置の効果を推定できる。
- 共変量のバランスを取り、バイアスを低減できる。
限界:
- マッチング可能な共変量しかコントロールできないため、未観測の交絡因子が存在すると推定が歪む可能性がある。
- データが少ない場合、特にカリパーマッチングを用いる場合には、マッチングが成立しないケースもある。
傾向マッチングは、医療や社会科学の研究で広く用いられており、観察データを用いて処置の効果を慎重に推定するための有力なツールである。