Brightics 19

[Brightics | 프로젝트] 코로나19 이후 건강실태 변화 확인하기 :: 데이터 수집 + 로드 error 처리

다들 한 주동안 잘지내셨나요 ~? 드디어 9월 새학기가 시작되고 전 이번에도 어김없이 개강을 맞이하게 되었는데요. 수강신청도 하고 강의계획서도 읽어보고 ~ 정말 개강을 슬슬 실감하고 있어요. ​ ​ 지난 주 멘토님들의 조언을 얻고 한층 탄탄해진 계획을 바탕으로 이제 본격적으로 데이터를 만져보도록 하겠습니다 :) 이건 제가 지난 첫 계획에서 세운 타임라인인데요, 모든 데이터들을 한꺼번에 전처리하기 보다는 분석개요를 3개의 파트로 나눠서 파트 별로 순차적으로 진행하는게 흐름 상 좋을 것 같더라구요 ! ​ ​ 그래서 오늘과 다음 시간에는 2020 코로나 이후 국민들의 건강실태 파악하는 현황 분석을 PART 1 으로 잡고 진행해볼까합니다 ! ​ 데이터 수집 먼저, 제가 사용할 데이터는 2020년 질병관리청 지역..

[Brightics | 실습] 개인 데이터 분석 프로젝트 :: 주제 선정 w/ 지역건강조사

어느새 열심히 브라이틱스 서포터즈로 달려온 지 4개월이 지났는데요, 팀 분석 프로젝트와 두 차례에 걸친 홍보 UCC 제작을 마치고 벌!써! 마지막 활동을 앞두고 있어요. ​ 브라이틱스와 윰 서포터즈와 함께 하는 데린이 탈출 프로젝트 ! 그 대망의 마지막 활동은 바로 개.인. 분석 프로젝트입니다. 두 달 넘게 팀원들과 회의하며 팀 프로젝트를 꾸준히 진행해오다가 갑자기 혼자 모든 일을 진행하려니 꽤나 막막했습니다🥺 마지막 개인 분석만큼은 평소 관심분야의 데이터로 다양한 접근을 해보고 싶은 제 욕심이 컸기 때문인가봐요 허허 주제를 이것저것 선정하면서 쉬운 길로 가려는 제 자신과 타협하지 않으려 애썼답니다 ^^ ​ 아직까지 패드에 적응 못 한 내 글씨체 .. 자유주제인 만큼 떠오르는 아이디어를 틈틈히 적어주었어..

[Brightics | 실습] kaggle(캐글) 로 Housing Data 모델링하기 (4) 모델링 편

이번 차시는 바로 데이터분석, 머신러닝의 꽃이죠 ! 바로 분석모델을 선택해서, 다양한 모델링을 진행해보는 시간​입니다. 저희가 목표로 하는 '예측하기'는 바로 회귀모델을 사용하는데요, Brightics 에는 과연 어떤 분석방법들로 구현 가능할 지 같이 공부해보아요 ! ​ 이번 모델링 작업도 마찬가지로 조원들과 분석기법을 나누어 회의를 토해 결과를 공유해보기로 했어요 최고의 조원들과 완성한 캐글데이터 분석, 과연 얼만큼 잘 예측해냈을지 잘 따라와주세요 ◠‿◠ ​ 작업 확인하기 본격적인 모델링에 들어가기 앞서, 이제껏 완성된 전 작업들을 간단히 확인해주어요 ! 결측치들을 꼼꼼히 제거해주고 이상치들도 없애주었어요. 그리고 범주형 변수들도 연속형으로 인코딩해주었답니다. ..

[Brightics | 실습] kaggle(캐글) 로 Housing Data 시각화하기 (3) EDA + feature 선택 편

​ 이번에는 팀원들과 각자 feature를 맡아서 eda를 해오기로 했습니다. 저희가 선택한 캐글의 Housing data가 80개가 넘는 변수로 이루어지다보니 모든 변수들에 대한 eda를 혼자서 진행하기엔 무리가 있는 것 같더라구요 이럴 때 필요한 게 바로 팀워크 !! 팀원들과 함께 해서 더 쉽고 빠르게 진행할 수 있었어요 ​ 1. EDA : 시각화 + 이상치 확인 먼저 eda를 하기 위해 팀원들과 각자 15개의 칼럼을 맡아 Brightics를 이용한 시각화를 정리해보았습니다. 저 같은 경우에는 변수들의 분포를 먼저 확인한 다음에 -> 수치형인 경우엔 너무 치우쳐져있진 않은지, 범주형은 unique와 frequency 차원에서 메리트가 있는 친구인지 확인 ->..

[Brightics | 실습] kaggle(캐글) 로 Housing Price 예측하기 (2) 전처리 편

이젠 팀 프로젝트 두 번째 시간, 전처리 편입니다 ! ​ 팀원들과 각자 변수들을 꼼꼼히 살펴본 후 회의를 거쳐 전처리 방법을 하나로 통일시키는 방식으로 진행하였어요 ​ 0. 데이터 설명 + 불러오기 먼저, 사용할 데이터는 kaggle의 competition 대회 데이터 중 House Price 데이터에요 ! ​ 2021.08.03 - [삼성 Brightics] - [Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편 [Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편 브라이틱스와 함께 [Brightics | BASIC] , [Brightics | 실습] 을 중심으로 함께 공부해온지 벌써 8주, 2달이 흘렀는데요 각종 예제와 실습으로 실..

[Brightics | 실습] 브라이틱스로 kaggle(캐글) 참여하기 (1) 기획 편

브라이틱스와 함께 [Brightics | BASIC] , [Brightics | 실습] 을 중심으로 함께 공부해온지 벌써 8주, 2달이 흘렀는데요 각종 예제와 실습으로 실력을 조금 쌓았으니, 데이터 분석에 관심이 있는 사람이라면 한 번씩은 도전해봤을 법한 Kaggle데이터도 도전해봅시다. ​ kaggle (캐글) 소개 여기서 잠깐, 캐글에 대해 간단히 알려드릴게요 . Kaggle 은 데이터 분석 경진 대회를 주최하는 플랫폼입니다.📊📈 개인 및 단체에서 해결하고 싶은 과제와 데이터를 등록하면, 캐글에 가입한 우리들이 모델을 개발하고 결과를 등록하는거죠. ​ 메뉴란에는 competition (현재 진행 중인 대회 소개) / dataset (개인,기업이 제공하는 다양한 데이터 저장소) / code (각자 사용..

[Brighitcs | UCC] 특종! 브라이틱스 서포터즈 홍보 UCC 영상 공개

약 3주동안 진행되었던 브라이틱스 홍보 UCC 영상 제작 프로젝트 ! 팀원들과 직접 기획부터 촬영 그리고 금손 서연피디님의 편집까지 저희가 하나부터 열까지 영상 제작에 많은 힘을 들였는데요 ​ 드디어 제작한 홍보 영상이 YOUTUBE에 업로드되었어요 지금 바로 시청해보실까요 ? https://www.youtube.com/watch?v=HIWsljz597A 조원들과 언제 업로드되지 ~ 하며 업로드되기만을 기다렸는데 드디어 오늘 !! 이렇게 올라오게 되었네요. 정말 열심히 준비했으니 다들 한 번 씩 봐주시고 좋아요 / 댓글 부탁드립니다 ! ​ ​ 그리고 홍보영상 외에도 브라이틱스 채널에 유익한 영상들이 많으니 많은 이용 부탁드려요 ㅎㅎ https://www.youtube.com/channel/UCglq4GN..

[Brightics | 실습] 흡연자 수와 코로나 사망자 수의 관계 파악하기 :: 회귀분석

​ 안녕하세요 ! 이번주는 개인 분석 미션의 마지막 주차 활동이 될 것 같은데요 ! 지난 시간까지 따릉이 데이터로 이용자와 이용 시간 분석을 EDA 시각화 작업으로 보여드렸어요. 오늘은 새로운 주제 로 돌아왔습니다. ​ 아직까지 코로나 역학 연구가 한창일텐데요 , 항상 코로나 원인 분석을 다룰 때면 "~~~한 사람이 코로나에 감염될 위험 더 높아 .."라는 뉴스를 많이들 접해보셨을 거에요. 오늘 저는 과연 흡연율이 높을 수록, 코로나로 인해 사망할 위험이 더 높은지 브라이틱스를 활용해서 분석 실습을 진행해보고자 합니다. ​ 주제 선정 및 DATA 수집 저는 작년 한 해 보건복지부에서 주관하는 금연서포터즈 14기로 활동했었는데요, 코로나 19의 고위험군으로 흡연자가 포함된다는 사실을 ..

[삼성 SDS] Brightics 서포터즈 2기 발대식 후기

2021. 06. 10 브라이틱스 2기 발대식이 열렸습니다! 브라이틱스 2기 발대식은 작년과 동일하게 코로나 19로 인해 비대면 온라인으로 진행되었습니다. 개인적으로 정말 아쉬웠지만 멘토님들과 운영진분들의 따뜻한 축사들을 들으며 아쉬움을 달랠 수 있었습니다 :) Brighitics 서포터즈 브라이틱스 서포터즈는 어떤 활동을 하나요? Brightics 서포터즈는 이 Brightics를 적극 활용하여 분석 프로젝트를 진행하는 개인 미션에서부터 영상 미션 및 프로젝트까지 다양한 황동 사례와 활동 스토리를 sns에 게재함으로써 Brightics를 널리 알리는 대학생 홍보대사입니다. ​ 앞으로의 제 계획은 브라이틱스 사용법을 [Basic]단계에서 부터 [Advanced]단계까지 튜토리얼을 통해 알려드리고자 합니다..