캐글 4

[Brightics | 실습] 브라이틱스 kaggle(캐글) 팀 프로젝트 총 정리

약 5주간 달려왔던 브라이틱스 팀 프로젝트 지난 주 모델링과 평가까지 무사히 프로젝트를 마칠 수 있었는데요, 하지만 서포터즈로서 미션은 아직 끝나지 않았다는 점 ! 프로젝트 결과보고서 / 실습 튜토리얼 영상 준비과정 / 썸네일 까지 모두 소개드리겠습니다. 프로젝트 결과 보고 먼저 지난 주 까지 마무리되었던 저희 프로젝트를 결과보고서로 정리해봤어요. 01. 데이터 소개 02. EDA 및 전처리 03. 모델링 04. 평가 및 결과 해석 순서로 4주간 회의했던 내용을 차곡차곡 담아보았답니다 EDA부터 결과 해석까지 정리된 보고서를 모두 보여드릴 순 없지만, 상세 내용이 궁금하시다면 제 블로그 + 저희 팀원들의 블로그를 방문하시면 자세한 이야기를 들을 수 있을 겁니다 :) https://blog.naver.co..

[Brightics | 실습] kaggle(캐글) 로 Housing Data 시각화하기 (3) EDA + feature 선택 편

​ 이번에는 팀원들과 각자 feature를 맡아서 eda를 해오기로 했습니다. 저희가 선택한 캐글의 Housing data가 80개가 넘는 변수로 이루어지다보니 모든 변수들에 대한 eda를 혼자서 진행하기엔 무리가 있는 것 같더라구요 이럴 때 필요한 게 바로 팀워크 !! 팀원들과 함께 해서 더 쉽고 빠르게 진행할 수 있었어요 ​ 1. EDA : 시각화 + 이상치 확인 먼저 eda를 하기 위해 팀원들과 각자 15개의 칼럼을 맡아 Brightics를 이용한 시각화를 정리해보았습니다. 저 같은 경우에는 변수들의 분포를 먼저 확인한 다음에 -> 수치형인 경우엔 너무 치우쳐져있진 않은지, 범주형은 unique와 frequency 차원에서 메리트가 있는 친구인지 확인 ->..

[Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편

브라이틱스와 함께 [Brightics | BASIC] , [Brightics | 실습] 을 중심으로 함께 공부해온지 벌써 8주, 2달이 흘렀는데요 각종 예제와 실습으로 실력을 조금 쌓았으니, 데이터 분석에 관심이 있는 사람이라면 한 번씩은 도전해봤을 법한 Kaggle데이터도 도전해봅시다. ​ kaggle (캐글) 소개 여기서 잠깐, 캐글에 대해 간단히 알려드릴게요 . Kaggle 은 데이터 분석 경진 대회를 주최하는 플랫폼입니다.📊📈 개인 및 단체에서 해결하고 싶은 과제와 데이터를 등록하면, 캐글에 가입한 우리들이 모델을 개발하고 결과를 등록하는거죠. ​ 메뉴란에는 competition (현재 진행 중인 대회 소개) / dataset (개인,기업이 제공하는 다양한 데이터 저장소) / code (각자 사용..

[Brightics | Basic ] 브라이틱스로 데이터 수집하기 :: 공공 데이터, 캐글 데이터 수집

이번 시간은, 브라이틱스와 함께 하는 데이터 분석의 Basic 단계를 설명해드리는 두 번째 시간입니다. 첫 시간에는 간략히 데이터 분석 프로세스를 소개해드리고, 모델링 작업과 친해지는 시간을 가졌었죠 ! 통계 기법과 머신러닝 기법들에 익숙해지기 위해선 모델을 만들어보고 계속해서 접해보는 것이 중요하다 생각해서 첫 시간으로 소개해드렸어요. ​ 그리고 지금부터는 분석 프로세스의 순서대로 데이터 수집부터 시작하여 전처리, eda, 모델링, 기계학습 까지 진행해보고자 합니다. 오늘은 데이터 분석을 하고자 마음 먹었을 때 !!! 초보자들이라면 한 번쯤은 겪어보았을 고민 데이터 자료는 어디서 가져와야하지 ? ... 직접 수집하기엔 시간이 부족한데 대체 어디서 내가 원하는 자료들을 쏙쏙 뽑아낼 수 있느냐 말입니다 ...