데이터요약과 표현
: PROC PRINT / MEANS / UNIVARIATE / FREQ / BOXPLOT / STANDARD
1. PROC PRINT
형식 :
PROC PRINT DATA =
VAR (출력할 변수)
BY (정렬)
SUMBY (소계)
PAGEBY (페이지별 출력)
SUM (변수 총합 출력)
WHERE (조건)
데코레이션 :
NOOBS (OBS 미출력)
LABEL (라벨 출력, 지정)
FORMAT (출력 포맷 지정)
OPTIONS (출력크기 지정)
TITLE (머릿말)
FOOTNOTE (꼬리말)
# 예시
# 첫 3줄 출력
:PROC PRINT DATA=class(obs=3);RUN;
# 관측치(obs) 제외하고 출력
:PROC PRINT DATA=class NOOBS;RUN;
# ID 문장 : SAS자료를 인쇄하면 자동으로 각 관측에 고유한 신분(OBS)가 출력된다. ID문장을 사용 할 땐 각 관측의 신분을 대신할 변수들을 지정해야 한다. :PROC PRINT DATA=class; ID number; RUN;
# VAR문장 : SAS자료에 포함된 변수의 출력 순서를 결정하는데 사용된다. 그리고 일부 변수만 출력을 원할 경우 사용
:PROC PRINT DATA=class; VAR name gender; RUN;
2. PROC MEANS
기초통계량이 나옴
![](https://blog.kakaocdn.net/dn/bdC9LT/btr5cTpsuld/snMtCoBsAkLGVZRwPqNKB1/img.png)
#예시
-> BY문
![](https://blog.kakaocdn.net/dn/dWv9kv/btr5fOHpIiz/hlIFMzjT9Cu5RqT8wKKgw0/img.png)
![](https://blog.kakaocdn.net/dn/cj9JRh/btr5e53FYen/STGTQzkHzyQg3SfwYYhLQk/img.png)
BY 문을 쓰면 두개로 나눠서 보여줌
-> CLASS문
![](https://blog.kakaocdn.net/dn/b0Hcm1/btr5e7Hds7L/kxjkkrkLRnckmAGIj8l7a1/img.png)
![](https://blog.kakaocdn.net/dn/cmAM9V/btr5dRLpjUf/PrdvZmkLAKKUoHQt04lRqk/img.png)
-> OUTPUT 문
![](https://blog.kakaocdn.net/dn/bn25qM/btr5gRKE03g/2pSo7cXB20bROLxKECht11/img.png)
NOPRINT 라서 VIEWTABLE 에서만 볼 수있음
그리고 CLASS 변수에 2개를 써서 각각 알아봄
그리면 자동으로 _TYPE_ , _FREQ_ 이 자동변수로 생성됨
이때 NWAY; 사용하면 TYPE이 제일 큰 마지막 타입만 출력함 !
-> TYPES() 문
![](https://blog.kakaocdn.net/dn/bJBE0c/btr5dRLpjWg/9xfZ5wfiGIT9elitBgW5K0/img.png)
![](https://blog.kakaocdn.net/dn/brXMnc/btr5dp2Fr0G/YsKKre6K3TnKns9agojxfK/img.png)
![](https://blog.kakaocdn.net/dn/ZN6wq/btr5gRRpR2Q/32bDZYPQXLDmY1uVXR2rj0/img.png)
![](https://blog.kakaocdn.net/dn/RhKH0/btr5h9EheOo/RdeCG97g5lUq8X6J83L6q1/img.png)
3. PROC UNIVARIATE
- 적률에 기초한 다양한 기술 통계량을 계산
- 극단값, 중위수, 4분위수 등에 대한 상세한 정보를 계산
- 위치모수나 척도모수에 대해서 절사평균(trimmed mean)과 같은 로버스트(robust) 추정값을 계산
- 추정값에 대한 신뢰구간 계산
- 정규성 검정 수행
- 줄기와 잎 그림, 상자도표 그림 출력
+) 추가로 HISTOGRAM , PROBPLOT , QQPLOT 등을 구할 수 있음.
# 예시
![](https://blog.kakaocdn.net/dn/NGRpi/btr5eo94yFR/bFSGhFkahy9hljfKTWkzhk/img.png)
->
![](https://blog.kakaocdn.net/dn/b9VG4x/btr5cSxibBY/PyqKoa01idlrk8bKCvMF01/img.png)
![](https://blog.kakaocdn.net/dn/bAtCSJ/btr5jba1TKW/BDmy5PcBVhXPgLREnkQVQ1/img.png)
![](https://blog.kakaocdn.net/dn/bJlUSn/btr5e5JoJFv/VaFtgY3cuufRcJveXxz7i1/img.png)
-> AGE 의 경우
![](https://blog.kakaocdn.net/dn/n1LBL/btr5cSKRmgP/fx7cr2YfABiudTGKn2bP2k/img.png)
![](https://blog.kakaocdn.net/dn/dzVYdr/btr5fmD8goI/H3XjBt2t4a3Yz5HkqRZvK1/img.png)
![](https://blog.kakaocdn.net/dn/rRV7p/btr5iaDcJgt/vgDpEzeKZOzSrxooLUVVG0/img.png)
![](https://blog.kakaocdn.net/dn/dcV4N2/btr5nHHrWgj/Q97JW9Ln6wuphaUh0k9DAK/img.png)
![](https://blog.kakaocdn.net/dn/05QEh/btr5demRnBd/iaPKsgeeKnUHZ4nqudjQRK/img.png)
![](https://blog.kakaocdn.net/dn/35JaF/btr5guPszQm/B9xaFAKXeNANI9kVWGdFXK/img.png)
![](https://blog.kakaocdn.net/dn/bFLTyC/btr5nIl3tT6/OXfQkdLmMz5FiBT2Z1v251/img.png)
![](https://blog.kakaocdn.net/dn/cn21RN/btr5d3ykL8Y/KJoatpHiog5cpMBpMsIZt1/img.png)
1) HISTOGRAM 으로 분포 모양 유출
2) 정규확률도 . 정규분위수 직선 그래프로 확인하기
3) 정규성 검정으로 확인.
#예시 2
1. TOTAL 기술통계량 구하기
![](https://blog.kakaocdn.net/dn/Ccn87/btr5gtwd7Fj/mAHRypuXQN32N5m4nujONk/img.png)
-> TOTAL 변수 기술통계량 구하기
2. 학과별 mid 변수에 대한 줄기 잎 그림, 상자 그림 ( 우선 설정 -> 결과 -> ODS 그래프 사용 해지)
![](https://blog.kakaocdn.net/dn/YAcFT/btr5gQSvci7/kPqLrwL9Lkmw5okXvhjzEK/img.png)
![](https://blog.kakaocdn.net/dn/Ie6mD/btr5aFE0yBx/mKVCwXlU6GAqfHKUy1xVuk/img.png)
![](https://blog.kakaocdn.net/dn/Rc5K5/btr5jcHKFzb/Z5rgF3WviWiesqx6uST3j1/img.png)
3. TOTAL 변수 HISTOGRAM구하기
PROC UNIVARIATE DATA=class PLOT
HISTOGRAM total;
RUN
![](https://blog.kakaocdn.net/dn/efy0xg/btr5cTC0PwY/Qtma2jQhzKCYitqkrGzdw1/img.png)
4. TOTAL 의 평균과 표준편차를 OUT1으로 데이터셋 새로 생성
PROC MEANS DATA = class NOPRINT;
VAR total;
OUTPUT OUT=out6
MEAN(total)=total_m
STDERR(total)=total_s;
RUN;
4. 학과dept 별 mid 변수에 대한 줄기 잎 그림과 상자그림
PROC SORT DATA=class;
BY dept;RUN;
PROC UNIVARIATE DATA=class PLOT;
VAR mid;
BY dept;
RUN;
'데이터 스터디 > SAS' 카테고리의 다른 글
SAS - 데이터 요약 및 표현 (PROC FREQ, BOXPLOT) (0) | 2023.03.22 |
---|---|
SAS - 데이터 셋의 결합 및 관리 (merge, do-loop문, 자동변수, 외부파일 put문) (0) | 2023.03.22 |
SAS - 명령문 (if 조건문,retain, array) (0) | 2023.03.22 |
SAS - 구분자(dlm, dsd) , 할당문, 날짜함수 (0) | 2023.03.22 |
SAS - 변수 속성 할당 (0) | 2023.03.22 |