브라이틱스스튜디오 28

[Brightics | 실습] 스포티파이(spotify) 데이터로 음악 취향 고르기 :: 군집분석(k-means)

안녕하세요 ! 브라이틱스 서포터즈 2기 김유민입니다. 저번 시간 회귀분석으로 진행한 코로나19 데이터 실습 내용은 잘 보셨나요? 우리가 앞으로 공부할 머신러닝의 방법에는 예측이 가능한 지도 학습 / 라벨링이 되어 있지 않아 직접 데이터로부터 패턴을 찾아내는 비지도학습이 있는데요. 지도학습에는 회귀(regression)과 분류(classification) 그리고 비지도학습에는 군집(clustering)이 대표적입니다. 따라서 이번 시간에는 머신러닝의 '비지도 학습' 중 하나인 'k-means'로 실습을 진행해보겠습니다. 오늘의 주제는 바로 ! 스포티파이 (spotify) 데이터 입니다 ! 주제 선정 및 DATA 수집 SPOTIFY, 스포티파이는 전 세계 최대의 음원 스트리밍 서비스입니다. 스포티파이는 대부..

[삼성 SDS] Brighitcs AI와 함께하는 금융데이터 마케팅 온라인 무료 세미나 안내

다들 주목 주목 !! 이번 포스팅은 특별히 데이터 분석이 아닌 삼성SDS 소식을 들고 왔습니다. 여러분 중에 혹시 머신러닝/딥러닝/AI 에 대해 관심을 갖고 계신 분이 있나요? 각 분야에서 말로만 듣던 이 친구들이 과연 어떻게 적용되고 있는지 궁금하지 않으신가요? ​ 바로 6월 30일 수요일 2시 ! 삼성 SDS에서 온라인 무료 세미나를 개최합니다. AI기반 실시간 데이터 분석 마케팅과 고객 로열티 향상 전략 (with Brightics AI) 디지털 기술이 기업 비지니스를 혁신하는 DIGITAL Transformation 시대, 삼성 SDS는 금융사들과 함께 21세기 디지털 기술 혁신과 지속적인 기술 변화에 힘쓰고 있습니다. 국내 최고의 금융사들과 함께 만든 금융데이터 분석 사례를, 20일 수요일 웨비..

[Brightics | 실습] 흡연자 수와 코로나 사망자 수의 관계 파악하기 :: 회귀분석

​ 안녕하세요 ! 이번주는 개인 분석 미션의 마지막 주차 활동이 될 것 같은데요 ! 지난 시간까지 따릉이 데이터로 이용자와 이용 시간 분석을 EDA 시각화 작업으로 보여드렸어요. 오늘은 새로운 주제 로 돌아왔습니다. ​ 아직까지 코로나 역학 연구가 한창일텐데요 , 항상 코로나 원인 분석을 다룰 때면 "~~~한 사람이 코로나에 감염될 위험 더 높아 .."라는 뉴스를 많이들 접해보셨을 거에요. 오늘 저는 과연 흡연율이 높을 수록, 코로나로 인해 사망할 위험이 더 높은지 브라이틱스를 활용해서 분석 실습을 진행해보고자 합니다. ​ 주제 선정 및 DATA 수집 저는 작년 한 해 보건복지부에서 주관하는 금연서포터즈 14기로 활동했었는데요, 코로나 19의 고위험군으로 흡연자가 포함된다는 사실을 ..

[Brightics | Basic ] 브라이틱스로 데이터 수집하기 :: 공공 데이터, 캐글 데이터 수집

이번 시간은, 브라이틱스와 함께 하는 데이터 분석의 Basic 단계를 설명해드리는 두 번째 시간입니다. 첫 시간에는 간략히 데이터 분석 프로세스를 소개해드리고, 모델링 작업과 친해지는 시간을 가졌었죠 ! 통계 기법과 머신러닝 기법들에 익숙해지기 위해선 모델을 만들어보고 계속해서 접해보는 것이 중요하다 생각해서 첫 시간으로 소개해드렸어요. ​ 그리고 지금부터는 분석 프로세스의 순서대로 데이터 수집부터 시작하여 전처리, eda, 모델링, 기계학습 까지 진행해보고자 합니다. 오늘은 데이터 분석을 하고자 마음 먹었을 때 !!! 초보자들이라면 한 번쯤은 겪어보았을 고민 데이터 자료는 어디서 가져와야하지 ? ... 직접 수집하기엔 시간이 부족한데 대체 어디서 내가 원하는 자료들을 쏙쏙 뽑아낼 수 있느냐 말입니다 ...

[Brightics | 실습] 서울시 공유 자전거 이용자 & 이용시간 분석:: EDA, Chart 생성, 레포트 작성

2021.06.15 - [삼성 Brightics] - [Brightics | 실습] 브라이틱스로 본 서울시 공유 자전거 현황 :: 데이터 전처리편 개인미션 2주차 ! 저번 시간까지 데이터 전처리와 업로드 단계를 모두 마쳤습니다. 이젠 데이터를 샅샅이 따져보는 EDA시간을 가져볼까해요. 그리고 알아낸 통계값들은 보기 좋게 차트로 정리해서 Brightics 만의 레포트 기능까지 완성해보려고 합니다. 오늘도 얼른 시작해보겠습니다. 혹시 잊으신 분들을 위해, 다시 한번 더 말씀드리자면 ! 저는 서울시 공공자전거인 따릉이의 현황을 데이터로 분석해보고자 해요. 이를 통해서 시간, 요일별 이용량 그리고 성별 연령별 비교를 통한 따릉이 유저들을 알아내보고자 합니다 :) 지난 시간까지의 내용은 아래에서 확인하실 수 있어..

[Brightics | 실습] 브라이틱스로 본 서울시 공유 자전거 현황 :: 데이터 전처리편

​ 안녕하세요 ! 이번주를 시작으로 약 3주간 개인분석 프로젝트가 진행될 예정인데요 , 첫 개인 분석인 만큼 정말 설렙니다 ٩(๑>∀ 공공데이터 | 서울열린데이터광장 저는 서울 열린데이터광장에서 제공하는 공공데이터를 이용했어요. ​ 서울 열린데이터광장에는 인구/가구 , 주택/건설, 교육, 교통, 환경, 복지, 문화/관광 등 다양한 유형의 데이터셋을 제공하고 있습니다. 디테일한 데이터들이 많이 올라와 있으니 위 링크를 통해 확인해보시면 좋을 것 같네요:) ​ 제가 선택한 자료들은 요 3개 입니다! ​ 서울시에서 공공자전거와 관련되서 10개가 넘는 공공데이터들을 제공해주고 있어서 하나하나 꼼꼼히 읽어보았어요. ​ 대여이력 정보의 경우 , 대여 일시와 반납 일시가 나와있어서 시간대별 이용건수를 파악할 수 있습..

[Brightics | Basic ] 브라이틱스 기본 사용법 익히기 :: 프로젝트 생성 및 모델링

Brightics Studio 설치까지 모두 끝냈으니, 이제 본격적으로 Brightics Studio와 친해져볼 시간입니다. 앞으로 쉬운 연습 단계부터 어려운 실습 단계까지 차근차근 따라오실 수 있도록 Basic Level / Intermediate Level / Advanced Level 로 나누어 설명드릴 예정입니다. ​ 독자분들의 수준에 맞게 level을 선택해서 읽어주시면 감사하겠습니다 :) 데이터 분석, 어디서부터 시작할까? 데이터 분석 순서 알고가자 데이터분석을 하는 과정은 [수집] : 분석 목적에 맞는 데이터를 수집 ex. 공공데이터 포털에서 데이터를 가져오기, 웹크롤링 등 -> [탐색 & 전처리] : 요약 통계량 확인, 결측값 , 이상값 처리 -> [모델링] : 전처리한 데이터를 분할하여 ..

[삼성 SDS] Brightics 서포터즈 2기 발대식 후기

2021. 06. 10 브라이틱스 2기 발대식이 열렸습니다! 브라이틱스 2기 발대식은 작년과 동일하게 코로나 19로 인해 비대면 온라인으로 진행되었습니다. 개인적으로 정말 아쉬웠지만 멘토님들과 운영진분들의 따뜻한 축사들을 들으며 아쉬움을 달랠 수 있었습니다 :) Brighitics 서포터즈 브라이틱스 서포터즈는 어떤 활동을 하나요? Brightics 서포터즈는 이 Brightics를 적극 활용하여 분석 프로젝트를 진행하는 개인 미션에서부터 영상 미션 및 프로젝트까지 다양한 황동 사례와 활동 스토리를 sns에 게재함으로써 Brightics를 널리 알리는 대학생 홍보대사입니다. ​ 앞으로의 제 계획은 브라이틱스 사용법을 [Basic]단계에서 부터 [Advanced]단계까지 튜토리얼을 통해 알려드리고자 합니다..