대외활동/Brightics 서포터즈

[삼성 SDS] Brightics A.I 둘러보기 : 회원가입부터 Trial 체험 솔직 후기

케이와이엠 2021. 6. 8. 10:48

이번 포스트에서는 본격적인 데이터 분석에 들어가기 앞서

Brightics AI 계정 생성 후 무료 체험판을 간단히 둘러볼 예정입니다.

1. My Trial 계정 만들기 
: 가입 진행

SAMSUND SDS 홈페이지에서 계정 만들기

 

계정 만들기 바로가기

사용 계정 만들기

해당 링크에 접속하면, 위와 같은 로그인 창을 볼 수 있어요.

(삼성 SDS 홈페이지 우측 상단에 있는 My Trial 버튼을 누른 화면입니다.)

 

계정 만들기 click !

-> 간단한 개인 정보 입력 -> 이메일 확인 받기 -> 생성 완료

 

2. 무료체험 신청

Brightics AI / Machine learning 제공 형태 및 가격

 

SAMSUNG SDS가 제공하는 Brightics AI 플랫폼은 유료 플랜으로 진행됩니다.

이때 !

유저분들이 미리 사용해본 후 결정하실 수 있도록 60일간 무료 체험 기회를 제공하고 있답니다.

계정 생성 후 로그인을 하시면, <Brightics Machine learning>의 무료체험 신청 버튼이 나옵니다.

클릭 후 위와 같은 화면이 뜨면 무료 체험 신청 완료 !

 

My trial 화면 창에 보면, 현재 체험 중인 솔루션, 남은 기간 등을 확인할 수 있습니다.

또한 솔루션 시작하기 버튼을 누르면 , 본격적으로 체험해보실 수 있습니다

TIP | Brightics AI는 Chrome(크롬)에서 사용하면 빠르게 이용 가능해용

 

3. Brightics AI Trial 솔루션 체험해보기

 

오른 쪽 편에 위치한 '솔루션 시작하기' 버튼을 눌러주세요 .

[OPTION 1] Quick Start with Template

: Brightics AI가 제공하는 베스트 템플릿들의 예시를 보여줍니다.

별다른 분석 작업 없이 브라이틱스가 자체적으로 제공하는 샘플 템플릿이라고 보면 됩니다.

 

 

샘플 템플렛을 보여드릴게요. 

첫째는 가격과 판매량의 관계 탬플릿으로, 단순 선형 회귀분석을 이용한 상품가격이 판매량에 미치는 영향도 분석,

둘째는 로지스틱 회귀분석을 통한 내원고객에 대한 성별 분류 작업,

셋째는 MA(이동평균) EWMA(지수 가중치 이동평균) 통계 기법을 활용한 무연탄 수요 예측 분석 이 있네요.

이미 완성된 완성형 모델이 짠 하고 나타납니다. 분석 과정이 한.눈.에 담기네요.

 

 

[OPTION 2] Create new Project

: 사용자가 직접 새로운 프로젝트를 만듭니다.

우리도 Workflow Modeler를 선택해서 새로운 모델을 한 번 작성해봅시다.

 

왼쪽 상단에 Create New Project + 버튼을 누릅니다.

그 후 Project 이름을 설정하시고 , Workflow Modeler를 선택합니다.

또한 , 새로 만들 프로젝트 모델의 이름 & 부가설명을 적어주세요.

1) load 하기

오른쪽 상단에 보면 palette / return data / optimization 옵션이 위치해 있습니다.

palette 는 함수들을 선택할 수 있는 곳입니다.

 

 

Load 함수 선택 & 데이터 선택

저는 shared 폴더에 있는 simple.reg 데이터를 로드해주었습니다.

 

로드시켜보니, name/id/sample_qty/price 총 4가지 열로 구성되어있습니다.

이를 통해 제품의 종류와 제품의 가격과 판매수량간의 관계를 살펴볼 생각이에요.

저의 예측으로는 가격이 낮을 수록 판매수량이 많을 것이라고 생각되는데요.

 과연 실제 데이터로 입증가능할 지 확인해보겠습니다.

참고로 brightics 내부에 자체적으로 저장되어있는 csv. txt. 파일들이 너무 많아서 연습해보는데 정말 도움이 될 것 같다고 느꼈어요

 

2) CHART 만들기 

차트 세팅 버튼을 통해 복제를 한 후 scatter plot, histogram 등 다양한 차트로 변형시켜서 확인할 수 있습니다.

시각화가 중요한 만큼 색도 직접 지정할 수 있습니다. (color by)

이때 차트를 여러 개 만들고 싶다면,

하나의 차트 내에서 작업하는 것이 아니라 기존의 차트를 복제해서 이용해보세요 .

그 후 pop up chart 로 화면을 키워서 한 눈에 볼 수도 있답니다.

 

 

3) 기초통계량 Statistic Summary 만들기

다음으론 statistic summary 작업을 통해 우리가 흔히 알고 있는 기초 통계값들을 산출할 수 있습니다.

load함수와 그대로 연결시켜준 다음, input columns에 원하는 변수를 지정해줍니다.

그 결과 상품의 판매가격 중 가장 비싼 물건은 10만원, 가장 싼 물건은 만원이었고,

판매수량이 가장 높은 물건은 129개, 가장 낮은 물건은 9개 팔렸음을 쉽게 확인할 수 있어요.

4) Correlation 상관관계 확인하기

correlation

판매수량과 가격 사이의 상관관계가 존재하는지 확인해보았어요.

이때 방법은 피어슨 상관계수 / 스피어만 상관계수가 있는데

피어슨 상관계수 : 두 변수가 모두 연속형 자료일 때의 모수 검정

스피어만 상관계수 : 두 연속형 변수가 정규분포를 벗어나거나 or 두 변수가 순위 척도 자료 일때의 비모수 검정

저는 피어슨 상관계수를 통해 -0.69 값을 얻어냈습니다.

엄청 강한 상관관계는 아니지만 어느정도의 음의 상관관계를 지니고 있어 보입니다.

5) Linear Regression 회귀분석

이제 단순회귀분석을 해 볼 차례입니다.

앞서 가설을 ' 판매가격이 낮을 수록 판매수량이 많을 것이다'라고 설정했습니다.

따라서 판매가격을 독립변수로 두고, 판매수량을 종속변수로 예측하는 선형 회귀분석이 되겠습니다.

split data

먼저 split data 함수를 통해서 train data 과 test data를 8대 2로 일정한 비율로 나누어줍니다.

그 후, linear regression train이라는 함수에서 train data로 모델을 학습시켜줍니다.

앗, 이때 문제 발생 !!

RAW DATA를 그대로 이용하다보니 , 회귀식의 계수(coefficient) 값이 정말 정말 .. 못생겼습니다 ㅠ

그래서 transformation을 해주기로 마음 먹었습니다.

내장함수 중 Add Function Column 함수를 통해 price 값에 로그를 취해주었습니다.

 

이제 학습된 모델로 Predict 예측하는 시간입니다

Linear regression predict 함수를 통해 종속변수인 판매수량을 예측해봅니다.

마지막으로 Evaluate regression 함수에서 실제 판매수량 값과 비교하여 그 결과가 유효한지 확인해줍니다.

 

그 결과 !!!

R제곱 값은 0.533 이 나왔습니다

ㄴ R제곱은 독립변수가 얼마나 종속변수를 잘 설명하고 있는지를 알려주는데요, 그래서 이 설명력이 높아야 좋은 모델이라고 할 수 있습니다. 이때 0에 가까운 값이 아닌 중간 정도의 값이 나왔으니 어느정도 만족(?) 입니다 ㅎㅎ

그리고 p-value는 심지어 0에 가까운 수가 나와서 매우우우 유의미한 결과라고 볼 수 있겠네요

6) 뿌듯해하기 

simple.reg 데이터 분석을 통해 완성된 제 모델입니다 !!


이렇게 이번 포스트에선 Brightics ML을 슥슥 둘러보는 시간을 가져보았습니다.

제가 사용하고 너어어어무우우우 느낀 것은 왜 .. 이제야 알았지 ..? 입니다 ㅜㅜ

이때까지 해온 저의 분석 경험으로는 ... 라이브러리에서 데이터 로드해오고 ... 외부 프로그램이면 새로 인스톨해서 리드시키고 ... 전처리하고 ... 샘플 나눠서 모델링 하고 .. 에러 뜨고 ... 또 에러뜨고 ... 의 반복이었는데요

브라이틱스 스튜디오와는 코딩 없이 오직 문제해결 능력과 결과 해석 능력만 있으면 된다는 점 !

여러분도 브라이틱스 ML , 브라이틱스 AI와 여러분도 사랑에 빠지셨길 바랍니당 ㅎㅎ

그렇다면 전 Brightics STUDIO 설치 가이드라인을 알려드리는 포스트로 곧 돌아오겠습니다. 안녕 ~


게시글 관련 문의 및 소통을 원하신다면 아래 댓글로 남겨주세요

브라이틱스 사용 중 문의사항은

brightics@samsung.com으로 연락주세요 :)