ATE estimation
ATE estimationPermalink
바로 이전 글에서 살펴보았듯이, 교란변수confounder(공변량)이 모두 관측된다는 가정하에서 평균처치효과가 statistical estimand
Outcome AdjustmentPermalink
Outcome Adjustment(g-computation라고도 함)은 처치변수와 교란변수가 주어졌을 때 결과변수의 조건부 기댓값을 모델링하고자 하는 전략이다. 즉, 다음과 같은 조건부 기대 결과conditional expected outcome를 생각한다.
그러면, 이전에 다루었던 statistical estimand는 정의에 의해 다음과 같이 표현된다.
따라서 조건부 기대 결과를 이용해 추정한
이때 조건부 기대 결과
즉, 조건부 기대 결과가 제곱손실함수를 최소화하므로 우리는
와 같은 형태를 생각할 수 있고, 이로부터 다음 관계가 성립한다.
즉, Outcome-Adjustment 관점에서는 평균처치효과를 추정하는 것이 선형모형에서 모형의 계수를 추정하는 것과 유사한 논리를 가진다.
Propensity score adjustmentPermalink
Outcome adjustment 관점은 교란변수와 결과변수 간의 관계를 모델링하는 관점이었다. 반면 교란변수와 처치변수 간의 관계를 모델링할 수도 있는데, 이때 사용되는 정의가 propensity score이다.
정의Permalink
Propensity score
Propensity score을 이용하면, statistical estimand
Inverse Probability WeightingPermalink
위 표현으로부터 다음과 같은 추정치를 고려할 수 있다.
이를 Horvitz-Thompson Inverse probability weighted estimator역확률가중추정치 라고 정의하는데, 여기서 역확률 가중이란, 주어진 관측 데이터로는 처치변수
이때, IPW 추정치를 사용하기 위해서는 propensity score의 추정치를 구해야 한다. 그런데 Cross-entropy 손실함수나 제곱손실함수를 사용하면 각 손실함수
즉, 해당 손실함수 하에서 처치변수
Hájek estimatorPermalink
그러나 역확률가중추정치의 경우 어떠한 특정 대상의 propensity score가 0이나 1에 가깝게 되면 해당 대상에 대해 가중치가 극도로 커지는 문제가 발생한다. 이로 인해 추정치의 분산이 매우 커지게 되고, 이러한 문제를 극복하기 위해 Hájek은 IPW를 구조적으로 개선한 다음과 같은 추정치를 제안했다.
이를 Hajek estimator라고 한다. Hajek estimator의 분산은 일반적인 IPW의 분산보다 더 낮고 더 안정적인 추정이 가능하다 (Hirano, Imbens, Ridder, 2003). 또한, Hajek estimator는 각 가중치를 정규화했기 때문에, 각 그룹에서의 합이 1이 되는 특성이 존재한다.
Augmented IPW estimatorPermalink
앞서 살펴본 두 가지 방법은 각각 교란변수와 결과변수, 교란변수와 처치변수 간의 관계를 모델링하는 관점을 근간으로 한다. 각 방법에서 핵심은 결국 추정치
구체적으로, 역확률 추정치는 propensity score
따라서, 이를 해결하기 위해
InductionPermalink
이는 다음 성질로부터 유도된다. 맞게 설정된
PropertiesPermalink
- Doubly Robust estimator
는 propensity score나 outcome regression의 두 모델 중 하나만 정확하게 설정되어 있으면 일치성을 갖는다. 가 모두 정확히 모델링 되어있다면 DR 추정치는 역확률가중추정치보다 더 적은 분산을 갖는다.- Outcome model
만 정확히 모델링 된다면, DR 추정치는 일반적인 outcome adjustment 추정치보다 더 큰 분산을 갖는다.
ReferencesPermalink
- K. Murphy, Probabilistic Machine Learning-Advanced Topics
Leave a comment