데이터 스터디 63

SAS - 라이브러리 설정, DATA STEP, PROC STEP

네이버 블로그에 정리해두다가 .. 블로그에는 일상글만 남겨두고 싶어서 티스토리로 옮기는 중 [기초 공사] 1. 라이브러리 설정해놓기 - 영구 라이브러리 - 임시 라이브러리 - 사용자 라이브러리 기본적으로 6개 라이브러리가 뜨는데 첫 5개는 영구라이브러리 / WORK 파일은 임시 저장 (종료하면 사라짐) 사용자 라이브러리는 LIBNAME으로 만들어내자. 경로 지정한 것과 연결돼 LIBNAME'C:\파일명' 참고로 DATA 지정해줄 때는 KUSAS.[데이터셋으로 만들 이름]으로 설정하면 [이름]이라는 데이터셋을 만들었다는 거임 INPUT, CARDS 해서 안에 변수랑 값 넣어주는 거고 ! 2. DATA STEP/ PROC STEP -DATA STEP : 데이터 생성 구문 ! SAS DATA SET의 생성 및..

[Tableau] Find the Needle in the Haystack

2020 WOW Challenge - Week 31 : Can You Find the Needle in the Haystack? #WOW2021 week 22: Can You Structure the Unstructured? Introduction Superstore 데이터 Business improvement/optimization 기회를 얻기 위해 FOCUS ON 할 Product List를 만들어보자 Requirements 아래와 같은 작업을 할 예정 TOP 50 FOR SALE & UNPROFITABLE 한 제품 알아내기 HIGER OR LOWER than AVG_#_OF_CUSTOMER 인 것도 알아내기 → BAR 색칠하기 Product, Category, Sub-Category 는 같은 행 &..

[Tableau] Structure the Unstructured

2020 WOW Challenge - Week 22 : Can You Structure the Unstructured? #WOW2021 week 22: Can You Structure the Unstructured? Introduction 주제 : AirBNB 데이터 탐색 → 침실 개수에 따른 시애틀 방 가격 정도 알기 목표 : 비정형 데이터(unstructured data)를 cleaning 하는 작업 Requirements 아래와 같은 작업을 할 예정 현재, bedroom 개수 데이터는 없는 상황 . Let’s derive from description행 !! 특정 bedroom 개수에 해당하는 숙소 위치 지도에 표시 지도 클릭 시, 하이퍼링크 삽입 → 바로 사이트 소개로 연결 사용 기능 STEP 1..

[Tableau] Create a drill down using set action

2020 WOW Challenge - Week 30 : Can you create a drill down using set actions? 2020 Week 30: Can you create a drill down using set actions? [ ] 진행 중 Introduction STATE별 & CITY별 Sales vs Profit 비교 그래프 드릴 다움 drill down 기능 Requirements 아래와 같은 작업을 할 예정 산점도를 그리자 ! STATE clicki!! → CITY로 drill down !! 반대로도 CITY clicki!! → STATE로 drill back !! 컬러 지정 unprofitable / profitable 사용 기능 STEP 1. State 집합 만들기 →..

[2020 WOW Challenge] Compare Same Day to a Selected Date

2020 WOW Challenge - Week 20 : Can you compare Same Day to a Selected Date? 2021 Week 20 | Tableau: Can you compare Same Day to a Selected Date? Introduction 날짜 비교하기 월 / 연도 기준 같은 날짜 비교하기 ex. 2020 May 18th ↔ 2021 May 18th / 2020 May 18th ↔ 2020 June 18th [UPGRADE !!]일 기준 같은 날짜 비교하기 ex. 2021 May 18th Tuesday ↔ 2020 May 19th Tuesday ↔ 2021 April 20th Tuesday 즉 !! 숫자 상의 날짜(X) 실질적인 추세를 파악할 수 있는 요일 날짜..

[2021 WOW Challenge] CLV(Customer Lifetime Value) Matrix 그리기

2021 WOW Challenge - WEEK 2 : Can you build a Customer Lifetime Value Matrix? https://workout-wednesday.com/2021w02tab/ 2021 Week 2 | Tableau : Can you build a Customer Lifetime Value Matrix? – Workout Wednesday This year we’ve made a commitment to start with the basics and build, so this challenge is designed to do just that. This week, you’ll be constructing a Customer Lifetime Value Matrix (C..

[Tableau] 방탄소년단 앨범소개 대시보드 만들기

대시보드 소개 : 방탄소년단의 역대 타이틀 곡이 수록된 앨범을 소개하고, 타이틀 곡의 흥행 정도를 1) 뮤직비디오 조회수, 2) 좋아요 수, 3) 댓글 수 순위를 통해 확인해본다. 또한 1집부터 4집까지의 정규앨범 속에 담긴 방탄소년단의 메세지를 워드클라우드를 통해 알아본다. bts album 대시보드 | Tableau Public bts album 대시보드 타이틀곡 뮤비, 가사에 대한 대시보드 public.tableau.com 1. 데이터 셋 수집 방탄소년단 앨범 별 뮤직비디오 & 가사 데이터 크롤링 방탄소년단 앨범 속 타이틀 곡 (20곡)에 대한 뮤직비디오 조회수, 좋아요 수, 댓글 수 (210503 기준) 방탄소년단 정규 앨범 1집~4집 수록곡 가사 직접 크롤링 !! (데이터 셋 필요하신 분들은 댓..

[코드 분석] Bag of Words for IMDB movie review

Kaggle : Bag of Words Meets Bags of Popcorn 커널 필사 대회 소개 링크 : https://www.kaggle.com/c/word2vec-nlp-tutorial 영화리뷰를 읽고 그 리뷰가 영화를 추천하고 있는지 아닌지를 예측 평가하는 기준은 ROC커브 데이터 파일 labeledTraindata.csv - id/sentiment/review 3개의 칼럼- Id는 글쓴이, sentiment는 1이면 긍정, 0이면 부정적인 리뷰를 뜻하고 review는 직접 쓴 리뷰 testData.csv - sentiment가 빠진 2개의 열 [Reference] 캐글 : https://www.kaggle.com/c/word2vec-nlp-tutorial 깃허브 : https://github...

[코드 분석] Time Series Regression - Predict Future Sales 커널 필사

Regression : time-series regression 시계열 작성자 : 14기 김유민 Kaggle : Predict Future Sales 커널 필사 대회 소개 링크 : https://www.kaggle.com/c/competitive-data-science-predict-future-sales 비즈니스 소프트웨어 기업 1c company의 일별 판매 내역 데이터가 제공됨 다음 달 해당 스토어에서 판매되는 제품량 예측 상점 및 제품 목록은 매월 약간씩 변경되며 이러한 상황을 처리할 수 있는 강력한 모델을 만들자. 데이터 파일 sales_train.csv - 2013년 1월부터 2015년 10월까지의 일일 과거 데이터. train set test.csv - 상점과 제품의 2015년 11월 판매량..