[STATA] 두 샘플의 변수들 평균값 동시비교하기

Abstract:

When you need to compare mean values of multiple variables ‘ttest’ function in STATA does not work. In this case, ‘ttable2’ can be used to generate tables with means and mean differences with significance level between two different samples.


두 샘플의 대한 변수들의 평균값을 구할 때 기존의 방법으로는 ttest 기능을 사용하였다.

예를 들어 아래와 같은 조건일때,

변수명변수 값설명
설문01특정 설문에 참여 하지 않은 사람특정 설문에 참여 한 사람
a_서울경인출생01서울 경인 출신이 아닌 사람서울 경인 출신인 사람

아래와 같은 명령어를 사용하여 두 샘플간의 평균치가 다른지 특정 가능하다.

ttest a_서울경인출생 , by(설문)

하지만 이 명령어로는 한가지 변수 밖에 사용할 수 없다.

만약 변수값이 아래와 같이 늘어난다면

ttest a_서울경인출생 a_서울경인거주 , by(설문)

이런 오류 메시지를 볼 수 있다.

too many variables specified
r(103);

하지만 이는 Zhang & Li 가 제작한 명령어를 사용하면 해결 가능하다.

Xuan Zhang
Zhongnan University of Economics and Law
Wuhan, China
zhangx@znufe.edu.cn
Chuntao Li
Zhongnan University of Economics and Law
Wuhan, China
chtl@znufe.edu.cn

우선 ttable2를 설치한다.

신텍스 설명:

ttable2 varlist [if] [in], by(groupvar) format(%fmt)

위의 신텍스에서 볼 수 있듯 if & in & by 모두 사용가능하다.

ttable2 a_서울경인출생 a_서울경인거주 , by(설문)

위와 같은 결과값을 볼 수 있다.

G1(0) : 설문 = 0 의 Observation 수

G2(1) : 설문 = 1 의 Observation 수

Mean(1) : 설문 = 0의 평균값

Mean(2) : 설문 = 1의 평균값

MeanDiff: Mean(1) – Mean(2)

두 샘플의 평균값이 0이 아닐 확률:

*** = 0.01 significance lvl

** = 0.05 significance lvl

* = 0.10 significance lvl

    Leave Your Comment