ods excel file='/folders/myfolders/test/ods_ttest.xlsx';
proc ttest data=tmp.tico;
var age;
class group;
run;
ods excel close;
group별로 연령의 평균을 비교하여 결과를 excel 파일 형태로 내보내는 코드
var은 분석에 사용할 변수, class는 집단을 나누는 기준
네 번째 표는 등분산 검정 결과, p-value=0.8812이므로 equal variance 가짐
세 번째 표는 t-test 결과, 등분산을 가지므로 Equal의 p-value의 결과를 해석해야 함
> t-test 결과 p-value가 0.2561로 그룹 간 연령의 평균은 차이가 없다고 할 수 있음
2. 둘 이상의 그룹 간 평균 비교, ANOVA 프로시저, The ANOVA Procedure
둘 이상 그룹 간 평균 비교하기
ods excel file='/folders/myfolders/test/ods_anova.xlsx';
proc anova data=tmp.tico;
class group;
model age = group;
means group / hovtest=levene;
run;
ods excel close;
1의 t-test와 동일, group별 연령의 평균을 비교하여 결과를 excel 파일 형태로 내보내는 코드
class는 범주형 변수 할당,
model은 등호(=)를 기준으로 좌변에는 반응변수(평균을 나타낼 변수), 우변은 설명변수(요인)
means는 group에 따른 반응변수의 평균 출력, 옵션으로 hovtest=levene를 지정하면 등분산 검정
Model에 대한 유의성 검정 결과 p-value가 0.2561로, 그룹에 따라 연령의 평균 차이가 있다고 할 수 없음
평균, 표준편차, 분산, 중앙값, 사분위수, 최대값, 최소값, 극단값, 분포 그림을 구하기
proc univariate data=A.tico;
var BMI EF CKMB HbA1c;
by group;
histogram BMI;
probplot HbA1c;
run;
<코드 설명>
첫째 줄, A는 libname이고 tico는 데이터셋 이름
둘째 줄, var는 사용할 변수들. 출력할 변수들은 모두 여기 포함해 주어야 함
셋째 줄, by는 group의 level 별로 결과를 출력
넷째 줄, histogram을 출력할 변수
다섯째 줄, probplot은 분포도를 나타낼 변수
만약 모든 변수에 대해서 histogram이나 probplot을 뽑아내고 싶으시다면
histogram, probplot 뒤에 변수를 입력하지 않으면 됨
결과는 길어서 생략..
4. Excel 파일로 결과 내보내기
Excel 파일 형태로 결과 내보내기
ods excel file='/folders/myfolders/test/ods_excel.xlsx' style=seaside;
PROC MEANS DATA=A.tico N Mean STDDEV stackods;
VAR BMI EF CKMB HbA1c;
class age65;
RUN;
proc freq data=A.tico;
tables age65 gender group;
run;
proc univariate data=A.tico;
var BMI EF CKMB HbA1c;
by group;
histogram BMI;
probplot HbA1c;
run;
ods excel close;
ods excel과 ods excel close가 중요!! 가운데 부분은 위 1, 2, 3의 코드로 해당 결과를 내보내기 한다는 의미!