분류 전체보기 108

[취준일기] #3. 토스 Data Assistant 합격 후기(서류/포폴/코테/면접)

토스에서 데이터 어시스턴트 포지션에 합격한 후기를 남겨보겠다. 토스는 매년 데이터 분석/엔지니어/사이언티스트/QA 등의 포지션을 대규모로 채용하는 걸로 유명했다. 그만큼 데이터 기반의 빠른 의사결정을 하고 있다는 걸 채용시장만으로도 체감할 수 있었다. 공백기가 마침 생긴 상황에서, 토스에서 모집하고 있는 데이터 어시스턴트 공고를 발견했었다. 1. 서류 (이력서 + 포폴)지원한 공고는 위와 같았다. 나는 데이터분석 진로를 희망하고는 있지만, 분석을 위해선 앱서비스의 로그와 친해지는 게 중요하다고 생각했고 또 메타데이터가 어떻게 로깅되는지 프로세스를 확실히 이해한다면 향후 커리어에 도움될 것이라 판단했다. 그리고 무엇보다 공백기가 있는게 우려돼서.. 공고 뜨는 기업 중 가장 빨리 모집을 하길래 냉큼 지원..

[취준일기] #2. 번개장터 인턴 최종 합격 후기(포폴/코테/면접/입사)

두번째 취준일기로는 나의 두번째 IT플랫폼 회사인 번개장터 데이터분석 인턴 합격 후기를 남겨보겠다. 이 당시 네이버부스트캠프 AI Tech를 마무리하고 난 후 방황하던 시절 .. 정착하게 된 곳이다! 네부캠 이후로 AI가 아닌 데이터분석으로 다시 한 번 진로를 다잡게 된 후, 졸업 전 한 번의 인턴 기회를 더 얻을 수 있었다! 지원한 곳은 번개장터로 "세상 모든 물건에 새로운 가치를, 그리고 소비는 지속 가능하게" 라는 비전 아래에서 스트레스 프리 중고거래(리커머스) 경험을 선사하는 서비스 회사이다. 지원 전에도 당근마켓보다는 번개장터를 더 애용하고 있던지라 사용자 관점과 기업 관점을 모두 경험해 볼 수 있다는 점에 끌렸다. 전형 절차 : 서류전형 - 코딩테스트 - 1차 면접 - 최종 합격1. 서류 ..

[취준일기] #1. 카카오페이 어시스턴트 최종 합격 후기(서류/포폴/면접/입사)

오늘은 나의 첫 IT플랫폼이었던 카카오페이의 데이터 추출 인턴(=어시스턴트) 합격 후기를 남겨보고자한다. 사실 입사한지 제법 지났지만, 본격적인 취준을 준비하고 있는 지금.. 면접준비하면서 회고를 많이 해뒀기 때문에 작성하는데 큰 무리는 없을 듯 하다! 과거도 돌이켜볼겸, 그리고 데이터 분야로 진로를 시작하려는 분들께도 도움이 됐으면 좋겠는 마음으로 작성해보겠당 아! 그리고 어시스턴트가 인턴이랑 뭐가 다르지하는 분들이 있을텐데, 카카오계열은 채용연계형 인턴만 '인턴'이라는 직급을 붙여주고 체험형 인턴에게는 '어시스턴트'라는 직급을 붙이고 있다는 점 참고! 전형 절차 : 서류전형 - 1차 면접 - 최종 합격 1. 서류 (자소서 + 포폴)당시 데이터분석으로 인턴 경험을 쌓고 싶어서 정말 많은 기업에 지원을..

[네이버 부스트캠프] AI Tech 6기 합격 후기(자소서, 코테)

아래는 내가 2023년도에 도전했던 네이버부스트캠프 합격 및 참여 후기이다. 오랫동안 꼭 참여하고 싶었던 네부캠을 1트만에 들어갈 수 있었던 게 참 감사한 일이었고 비록 완주는 못했지만 내 진로와 적성을 다시 바로 잡을 수 있던 소중한 경험이었다. 지금 웹/모바일 부문 모집이 시작된 것으로 봐서 슬슬 AI tech 부문도 새로운 기수 선발을 시작할 것 같은데, 코테 초보자인 나도 한달만에 준비해서 합격했으니!! 많은 분들도 이 글을 보고 희망을 갖고 지원해보셨으면 한다!! 1. 부스트캠프 지원 준비 사실 ai tech 교육을 수강하고 싶다는 생각을 오래 전부터 해왔었다. 지원 전 내 스펙을 간단히 말해보자면 1) 통계학과 이중전공 2) 데싸 공부 경험 2년 3) IT플랫폼 데이터분석 인턴 경험 보유 ..

[SQL 케이스 스터디] 유저 인게이지먼트 하락 원인 찾기 - Drop in Engagement

가상 비즈니스 시나리오📌 Yammer 회사는 소셜 네트워크 (SNS) 를 주축으로 하는 회사로, 문서 공유, 채팅, 글 포스팅 등을 주고 받는 커뮤니티 기반 회사이다. 해당 회사의 Analyst로서 당면한 비즈니스 문제를 해결하는 것이 우리의 임무 !!Mission. WAU 하락 원인을 찾아오시오!문제 상황문제 : 7월 28일 (1442) → 8월 4일 WAU (1266)로 직전주 대비 12.21% 하락한 상황*WAU : the number of users who logged at least one engagement event during the week starting on that date. 즉, 1주일 내 한번이라도 플랫폼에 로그인한 유저 수SELECT DATE_TRUNC('week', e.oc..

[SQL 케이스 스터디] #1. Danny's Diner

SQL을 사용해 케이스 분석을 해보고 싶으신 분들이 많을 것 같습니다. 저도 SQL을 처음 배울 당시 정말 많은 사이트를 돌아다녔는데요, 그 중 가장 도움을 많이 주었던  https://8weeksqlchallenge.com 을 소개드립니다. 해당 사이트에는 총 8가지 비즈니스 시나리오가 기재되어있고, 각 비즈니스 상황에 맞는 지표(ex. 방문자수, 매출, 이탈율, 리텐션)를 뽑아보실 수 있습니다. 또한 사이트 내에 바로 SQL문을 짤 수 있는 툴이 제공되어 있어 별도로 환경을 설치하지 않으셔도 됩니다 ㅎㅎ  한 2년 전에 케이스1~3을 완료했었는데, 오랜만에 생각이 나 케이스8까지 차근차근 기록해보고자 합니다. Case Study #1 - Danny's Diner 🍜IntroductionDanny s..

[논문 읽기] BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding (NAACL 2019)

BERT ( Bidirectional Encoder Representations from Transformers) 2018년에 구글이 공개한 트랜스포머 기반의 사전 훈련된 모델 위키피디아(25억 단어)와 BooksCorpus(8억 단어)와 같은 레이블이 없는 텍스트 데이터로 사전 훈련 주로 fine-tuning을 거쳐 여러 task에 이용 → 사전 훈련된 BERT 모델 + 추가적 훈련 + 하이퍼 파라미터 재조정 BERT는 사전 학습을 위해 두 가지 방법 (Masked Language Model(MLM)과 Next Sentence Prediction(NSP))를 사용함으로써 BERT가 양방향으로 학습되어 문맥을 더 잘 파악할 수 있게 한다. # Intro 전이학습 모델 구글의 Devlin(2018)이 제안..

BoW(Bag of Words), DTM

단어의 표현 방법 단어의 표현 방법에 대한 큰 체계를 한 번 정리해보자면, 지금까지 원핫인코딩, n-gram까지는 짚어봤다. 이들은 단어들끼리의 관계를 봐주진 않았고, 해당 단어 자체만 보고 특정값을 매핑하는 방법이었다. 되새겨보자면, 원핫인코딩의 경우에는 해당하는 자리에는 1을 쓰고 그 이외에는 0으로 벡터를 다 채워줬었다. 그리고 n-gram에서는 해당 단어구가 전체 훈련문장들 사이에서 몇 번 등장하냐 카운트해줬었다. 그리고 이들을 국소표현이라고 한다. 반대로 단어들 간에 중심단어를 두고 주변단어를 둬서 둘 사이의 관계로 표현하는 방법은 분산표현이라고 한다. Bag of words Bag of words란 단어들의 순서는 전혀 고려하지 않고, 단어들의 출현 빈도수에만 집중해서 텍스트를 수치화하는 표현..

[논문 읽기] GPT-1 : Improving Language Understanding by Generative Pre-Training (OpenAI)

GPT1 Abstract 1. Natural language understanding comprises a wide range of diverse tasks such as textual entailment, question answering, semantic similarity assessment, and document classification. 2. large unlabeled text corpora are abundant, labeled data for learning these specific tasks is scarce 3.We demonstrate that large gains on these tasks can be realized by generative pre-training of a l..