캐글데이터 4

[Brightics | 실습] kaggle(캐글) 로 Housing Data 모델링하기 (4) 모델링 편

이번 차시는 바로 데이터분석, 머신러닝의 꽃이죠 ! 바로 분석모델을 선택해서, 다양한 모델링을 진행해보는 시간​입니다. 저희가 목표로 하는 '예측하기'는 바로 회귀모델을 사용하는데요, Brightics 에는 과연 어떤 분석방법들로 구현 가능할 지 같이 공부해보아요 ! ​ 이번 모델링 작업도 마찬가지로 조원들과 분석기법을 나누어 회의를 토해 결과를 공유해보기로 했어요 최고의 조원들과 완성한 캐글데이터 분석, 과연 얼만큼 잘 예측해냈을지 잘 따라와주세요 ◠‿◠ ​ 작업 확인하기 본격적인 모델링에 들어가기 앞서, 이제껏 완성된 전 작업들을 간단히 확인해주어요 ! 결측치들을 꼼꼼히 제거해주고 이상치들도 없애주었어요. 그리고 범주형 변수들도 연속형으로 인코딩해주었답니다. ..

[Brightics | 실습] kaggle(캐글) 로 Housing Data 시각화하기 (3) EDA + feature 선택 편

​ 이번에는 팀원들과 각자 feature를 맡아서 eda를 해오기로 했습니다. 저희가 선택한 캐글의 Housing data가 80개가 넘는 변수로 이루어지다보니 모든 변수들에 대한 eda를 혼자서 진행하기엔 무리가 있는 것 같더라구요 이럴 때 필요한 게 바로 팀워크 !! 팀원들과 함께 해서 더 쉽고 빠르게 진행할 수 있었어요 ​ 1. EDA : 시각화 + 이상치 확인 먼저 eda를 하기 위해 팀원들과 각자 15개의 칼럼을 맡아 Brightics를 이용한 시각화를 정리해보았습니다. 저 같은 경우에는 변수들의 분포를 먼저 확인한 다음에 -> 수치형인 경우엔 너무 치우쳐져있진 않은지, 범주형은 unique와 frequency 차원에서 메리트가 있는 친구인지 확인 ->..

[Brightics | 실습] kaggle(캐글) 로 Housing Price 예측하기 (2) 전처리 편

이젠 팀 프로젝트 두 번째 시간, 전처리 편입니다 ! ​ 팀원들과 각자 변수들을 꼼꼼히 살펴본 후 회의를 거쳐 전처리 방법을 하나로 통일시키는 방식으로 진행하였어요 ​ 0. 데이터 설명 + 불러오기 먼저, 사용할 데이터는 kaggle의 competition 대회 데이터 중 House Price 데이터에요 ! ​ 2021.08.03 - [삼성 Brightics] - [Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편 [Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편 브라이틱스와 함께 [Brightics | BASIC] , [Brightics | 실습] 을 중심으로 함께 공부해온지 벌써 8주, 2달이 흘렀는데요 각종 예제와 실습으로 실..

[Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편

브라이틱스와 함께 [Brightics | BASIC] , [Brightics | 실습] 을 중심으로 함께 공부해온지 벌써 8주, 2달이 흘렀는데요 각종 예제와 실습으로 실력을 조금 쌓았으니, 데이터 분석에 관심이 있는 사람이라면 한 번씩은 도전해봤을 법한 Kaggle데이터도 도전해봅시다. ​ kaggle (캐글) 소개 여기서 잠깐, 캐글에 대해 간단히 알려드릴게요 . Kaggle 은 데이터 분석 경진 대회를 주최하는 플랫폼입니다.📊📈 개인 및 단체에서 해결하고 싶은 과제와 데이터를 등록하면, 캐글에 가입한 우리들이 모델을 개발하고 결과를 등록하는거죠. ​ 메뉴란에는 competition (현재 진행 중인 대회 소개) / dataset (개인,기업이 제공하는 다양한 데이터 저장소) / code (각자 사용..