삼성SDS 22

[Brightics | Basic ] 브라이틱스로 데이터 수집하기 :: 공공 데이터, 캐글 데이터 수집

이번 시간은, 브라이틱스와 함께 하는 데이터 분석의 Basic 단계를 설명해드리는 두 번째 시간입니다. 첫 시간에는 간략히 데이터 분석 프로세스를 소개해드리고, 모델링 작업과 친해지는 시간을 가졌었죠 ! 통계 기법과 머신러닝 기법들에 익숙해지기 위해선 모델을 만들어보고 계속해서 접해보는 것이 중요하다 생각해서 첫 시간으로 소개해드렸어요. ​ 그리고 지금부터는 분석 프로세스의 순서대로 데이터 수집부터 시작하여 전처리, eda, 모델링, 기계학습 까지 진행해보고자 합니다. 오늘은 데이터 분석을 하고자 마음 먹었을 때 !!! 초보자들이라면 한 번쯤은 겪어보았을 고민 데이터 자료는 어디서 가져와야하지 ? ... 직접 수집하기엔 시간이 부족한데 대체 어디서 내가 원하는 자료들을 쏙쏙 뽑아낼 수 있느냐 말입니다 ...

[Brightics | 실습] 서울시 공유 자전거 이용자 & 이용시간 분석:: EDA, Chart 생성, 레포트 작성

2021.06.15 - [삼성 Brightics] - [Brightics | 실습] 브라이틱스로 본 서울시 공유 자전거 현황 :: 데이터 전처리편 개인미션 2주차 ! 저번 시간까지 데이터 전처리와 업로드 단계를 모두 마쳤습니다. 이젠 데이터를 샅샅이 따져보는 EDA시간을 가져볼까해요. 그리고 알아낸 통계값들은 보기 좋게 차트로 정리해서 Brightics 만의 레포트 기능까지 완성해보려고 합니다. 오늘도 얼른 시작해보겠습니다. 혹시 잊으신 분들을 위해, 다시 한번 더 말씀드리자면 ! 저는 서울시 공공자전거인 따릉이의 현황을 데이터로 분석해보고자 해요. 이를 통해서 시간, 요일별 이용량 그리고 성별 연령별 비교를 통한 따릉이 유저들을 알아내보고자 합니다 :) 지난 시간까지의 내용은 아래에서 확인하실 수 있어..