강의명: STATA를 이용한 패널분석
강사: 김현식, 경희대학교 사회학과 (http://kpc.khu.ac.kr)
<본 게시글은 김현식 강사의 강의자료를 토대로 본인의 공부목적으로 제작된 본인의 생각이 합쳐진 결과물일 뿐 김현식 강사의 생각을 대변하지 않음을 밝힘>
종속변수(Dependent Variable, Outcome Variable)와 원인변수(Treatment Variable) 를 바꾸어 모형을 추정해도 종속변수(Dependent Variable)가 원인변수(Treatment Variable)에 영향을 주는 것 처럼 나타난다.
T —> Y vs Y —> T
- 즉, 통계는 연관을 보여줄 뿐 인과 관계를 보여주는 것이 아님
- 따라서 분석을 하거나 다른 이의 분석을 평가할 때, 항상 역인과관계를 고려해야함
역인과관계를 다루는 가장 좋은 방법은 시간을 이용하는 것
- 즉, 원인변수(Treatment Variable)를 결과변수(Outcome Variable)보다 먼저 측정하면 혹은 먼저 생성된 것으로 측정하면 역인과관계에 대한 비판을 약화시킬 수 있음:
- T(t-1) —> Y(t) vs Y(t) —> T(t-1)
실례
- 부모 이혼과 아동 성장: 청소년기 아동의 우울증 증상과 비행이 부모사이의 관계를 악화시킨다는 연구 (Cui, Donnellan & Conger, 2007)
- 여성의 노동시장참여와 출산의 관계: 출산을 하고자하거나 앞둔 여성은 노동시장에서 퇴장하는 경향이 있음
Simulation Model 1:

T: 원인변수 (Treatment Variable)
Y: 결과변수 (Outcome Variable)
인과관계: T —> Y
역인과관계: T <— Y
clear all
set seed 85672
set obs 10000
// 10000개의 관측치를 만듬
gen tvar=rbinomial(1,0.5)
// 0과 1의 값을 각 50% 갖는 바이노미얼 디스트리뷰션의 tvar를 만들기
gen yvar=0.5+tvar+rnormal(0,1)
// yvar는 tvar의 Function임
sum
reg yvar tvar

Simulation Model 2:

위 모형을 P(T=1)에 대해 정리하면,

clear all
set seed 85672
set obs 10000
gen yvar=rnormal(0,1)
gen tvar=rbinomial(1,1/(exp(-yvar)+1))
// 똑같은 Seed를 가지고 P(T=1)의 확률로 0, 1 바이너리를 제너레이트함
sum
logit tvar yvar
reg yvar tvar
