SAS - 명령문 (if 조건문,retain, array) # if 조건문 1) if 조건문 then statement ; - 조건문이 참이면 statement 수행하고 그렇지 않으면 수행하지 않는다. 2) if 조건문 do statement1 statement2 --- end - statement가 두 개 이상일 때 do end 문을 쓴다. 3) if 조건문 then statement1 ; else statement2; - 만약 조건문이 참이면 수행하고, 거짓이면 statemetn2를 수행 80 데이터 스터디/SAS 2023.03.22
SAS - 구분자(dlm, dsd) , 할당문, 날짜함수 # 구분자의 종류 : DLM , DSD 1) DLM -여러 개의 문자를 지정 -연속된 구분자는 1개로 간주함 -기본 구분자는 공백 2) DSD -연속된 구분자는 결측값 포함 -문자열 " "로 표시 -기본 구분자는 ',' 쉼표 이다. 3) TAB구분자 : EXPANDTABS DLM은 연속된 구분자를 1개로 간주 & 기본 구분자는 공백 1aa2ab3 -> 1(공백)(공백)2(공백)(공백)3 ->1(공백)2(공백)3 -> 123 4b5bab6 -> 4(공백)5(공백)(공백)(공백)6 -> 4(공백)5(공백)6->456 7a8b9 -> 7(공백)8(공백)9 -> 789 -DSD는 연속된 구분자는 결측값 포함 - DSD가 있는 경우 공백 사이에 .을 추가 공백이 둘이면 (공백).(공백) 공백이 셋이면 (공백).(.. 데이터 스터디/SAS 2023.03.22
SAS - 변수 속성 할당 1. LABEL 명령문 LABEL 변수1 = '라벨이름' 변수2='라벨이름' ....; 2. FORMAT 명령문 FORMAT 변수이름 출력형식 이때, 출력형식 종류 ! $4. (문자형 4글자) , 12. (소수0번째 자리 까지 나타내 = 정수 나타내), 12.2 (소수 두번째 자리까지 나타내), COMMA12.2(천번째에 쉼표 사용하고 소수2번째 자리까지 나타내기. 총 12글자까지 읽을 수 있어) DOLLAR12.2(달러랑 쉼표 사용하기) YYMMDD10.(1961-01-01) 3. RENAME 원래 변수명 = 바꾸고자 하는 새로운 변수명 ex) total = sum => total 변수이름을 sum으로 변경 ! 4. TITLE문 FOORNOTE문 5. RETAIN문 바로 직전의 data 단계에서 숳ㅇ된.. 데이터 스터디/SAS 2023.03.22
SAS - 함수(문자, 난수, 날짜, 숫자 절단, 형변환) 4장. DATA STEP 2 01. 변수의 정의 02. 새로운 변수 생성 03. SAS 함수 # SAS 함수 -SAS함수는 해당 함수명과 그에 따르는 인수를 필요로 하며 반드시 괄호() 안에 입력해야 한다. - 기본 형식 : 함수명(인수1, 인수2, ----) - 난수함수 : 특정 분포로부터 유사 확률난수를 발생 - 확률밀도함수와 분포함수 -표본통계량함수 : 총 17가지 표본통계량 -산술함수 : 최소, 최대, 평균 등 - 수학함수 : 지수, 로그, 감마함수 등 -분위수함수 : 특정확률분포의 분위수 계산 - 문자함수 : 특정문자에 대한 연산을 수행 # 문자함수 ex) TRIM - trim 옵션과 ||를 이용하여 공백없이 다른 열의 data 붙이기 [예시] 1단계. 데이터셋 a_1 만들기 2단계. || 만.. 데이터 스터디/SAS 2023.03.22
SAS - 데이터 읽기 실습 (input, infile, proc import, dlm='') 3장. DATA STEP 1 이번엔 저번에 다루었던 RAW DATA 읽기 명령문을 사용해서, 데이터 실습해보자 이때 잠깐, WORK 탐색기에 너무 많은 데이터셋이 저장되어 있다. 이를 지울려면 하나 하나 지울수도 있지만 PROC DELETE DATA=삭제하려는 데이터셋; RUN; 을 해보자 EX. proc DELETE data=one1-one7; run; 1. COLUMN INPUT : 고정 포맷 & 표준 데이터 유형 - 열 번호 지정 - 자료값이 고정된 열을 갖고 있어야 함 : 시작 위치 - 끝 위치 표시 -- 문법 : 변수명 / 변수유형($인지 아닌지) / 시작위치-끝위치 EX. age 1-2, gen$ 6-18, gen$3-3 = gen$3 COLOUMN INPUT은 시작위치, 끝 위치를 지정하기 .. 데이터 스터디/SAS 2023.03.22
SAS - raw 데이터 읽기 (length, & : 연산자) 3장. DATA STEP 1 지난 번에 이어서 데이터 읽기 중 RAW DATA 읽기 문장 구성 * DATA 문장 *INFILE 문장 : INFILE 키워드 옆에 읽어 올 외부 파일의 경로 및 파일명을 따옴표 안에 지정 --firstobs : 자료를 불러들이기 시작하는 obs 지정. 두번째 줄부터 시작한다면 firstobs=2 라고 설정 --expandtabs : 자료의 사이가 tab으로 떨어져있는 경우 # RAW DATA 형태 - 고정(fixed-format) / - 자유(free-format) / -표준데이터유형(문자, 숫자 포함) / - 비표준데이터유형 1. 고정 포맷 & 표준 데이터 유형 => COLUMN INPUT - 각 변수의 값을 읽는 위치가 모든 레코드에서 동일하다. - 문법 : 변수명 / .. 데이터 스터디/SAS 2023.03.22
SAS - 데이터 입력 및 읽기 (list input, column input, formatted input, set, infile) 3장. DATA STEP 1 DATA Step에는 일반적으로 다음 중 하나의 문장이 있다. INPUT, SET, MERGE, UPDATE (이중에 input, set, merge 는 배운 상태, update는 초면 .. ) # 데이터 입력 방법 -list input(자유 입력), - column input(열 지정 입력) - formatted Input(포맷 입력) 1. 자유 입력_List Input - INPUT 문과 CARDS문 사용 (앞에서 흔히 쓰던 거) - INPUT : $는 문자형 변수에 사용 - CARDS : INPUT 자료의 개수만큼 관측값 입력, 빈칸(스페이스바)로 구분하기 - RUN : 단계가 끝남 * 자유 입력 시 주의할 점 ! input에 지정한 변수 개수랑 card에 넣은 관측값 .. 데이터 스터디/SAS 2023.03.22
SAS - 라이브러리 설정, DATA STEP, PROC STEP 네이버 블로그에 정리해두다가 .. 블로그에는 일상글만 남겨두고 싶어서 티스토리로 옮기는 중 [기초 공사] 1. 라이브러리 설정해놓기 - 영구 라이브러리 - 임시 라이브러리 - 사용자 라이브러리 기본적으로 6개 라이브러리가 뜨는데 첫 5개는 영구라이브러리 / WORK 파일은 임시 저장 (종료하면 사라짐) 사용자 라이브러리는 LIBNAME으로 만들어내자. 경로 지정한 것과 연결돼 LIBNAME'C:\파일명' 참고로 DATA 지정해줄 때는 KUSAS.[데이터셋으로 만들 이름]으로 설정하면 [이름]이라는 데이터셋을 만들었다는 거임 INPUT, CARDS 해서 안에 변수랑 값 넣어주는 거고 ! 2. DATA STEP/ PROC STEP -DATA STEP : 데이터 생성 구문 ! SAS DATA SET의 생성 및.. 데이터 스터디/SAS 2023.03.22
[Tableau] Find the Needle in the Haystack 2020 WOW Challenge - Week 31 : Can You Find the Needle in the Haystack? #WOW2021 week 22: Can You Structure the Unstructured? Introduction Superstore 데이터 Business improvement/optimization 기회를 얻기 위해 FOCUS ON 할 Product List를 만들어보자 Requirements 아래와 같은 작업을 할 예정 TOP 50 FOR SALE & UNPROFITABLE 한 제품 알아내기 HIGER OR LOWER than AVG_#_OF_CUSTOMER 인 것도 알아내기 → BAR 색칠하기 Product, Category, Sub-Category 는 같은 행 &.. 데이터 스터디/BA 2023.02.01
[Tableau] Structure the Unstructured 2020 WOW Challenge - Week 22 : Can You Structure the Unstructured? #WOW2021 week 22: Can You Structure the Unstructured? Introduction 주제 : AirBNB 데이터 탐색 → 침실 개수에 따른 시애틀 방 가격 정도 알기 목표 : 비정형 데이터(unstructured data)를 cleaning 하는 작업 Requirements 아래와 같은 작업을 할 예정 현재, bedroom 개수 데이터는 없는 상황 . Let’s derive from description행 !! 특정 bedroom 개수에 해당하는 숙소 위치 지도에 표시 지도 클릭 시, 하이퍼링크 삽입 → 바로 사이트 소개로 연결 사용 기능 STEP 1.. 데이터 스터디/BA 2023.02.01