저는 현재
"서울시 건강 고위험 지역 분류 기반, 포스트코로나 시대를 위한 현대인의 건강증진 방향 제시'
에 대한 개인분석을 진행 중인데요,
이번 시간은 분석의 첫 번째 PART의 핵심 !
현재 코로나19 이후 국민들의 건강실태가 얼만큼 변화하였는지를
데이터로 직접 확인해보도록 할게요 ➛➛➛
/* 속성 전처리 가이드 */
먼저 select column 으로 null 값으로 구성된 칼럼들(2008년 2018년)은 drop 해줍니다.
그리고 세종시의 2009,2010,2011 자료가 항상 누락되는 점을 확인할 수 있는데요,
이는 바로 세종시가 2012년 7월 출범했기 때문이겠죠 !
그래서 특정 값이 아닌 측정되지 않음을 의미하는 0으로 대체해줍니다.
이처럼 데이터 활용능력만이 아닌, 배경지식을 아는 도메인지식도 분석에서 정말 중요하게 작용한다는 점 !
이렇게 다른 데이터들도 동일한 방식으로 전처리 완료 !
/* 연도 데이터 시각화하기 */
연도 데이터를 시계열처럼 시각화하고 싶은데
만약 연도가 따로 따로 칼럼으로 지정되어 있다면 ?!?!
이렇게 알 수 없는 .. 이상한 그래프가 나오게 되죠 ㅜㅜㅜ
따라서 열로 지정되어 있는 연도를 행 안으로 넣어주면 될 것 같은데요,
이때 <unpivot> 함수를 쓰면 유용하더라구요 !
이렇게 새롭게 연도를 변수로 삼아서 year라는 새로운 칼럼으로 만들어주고,
해당하는 값들은 value라는 새로운 칼럼으로 묶어누는 !
즉, 행과 열을 바꿔주는 함수랍니다 !
이렇게 전환해준 데이터를 사용해서 chart setting을 활용해서
시각화한 결과를 공유해보자면
다음과 같아요.
먼저 고위험 음주율 같은 경우
전국적으로 보자면, 다소 엎치락뒤치락하는 모습이지만 2018년을 기준으로 꾸준히 낮아지고 있어요.
서울시로만 한정한다면, 그 모습이 더 선명이 확인되어 지는데요 !!
코로나 직전인 19년도와 20년도를 비교해보았을 때 13% -> 9%로 가장 급격히 줄어들었어요.
이는 아마도 코로나19 직후 사적 모임과 회식이 자제되는 분위기가 조성되었을 뿐아니라,
사전적 예방 조치로 유흥업소 운영제한과 가게들의 운영시간 제한 등의 정책 시행의 영향을 받은 게 아닌가 생각드네요 !
다음으로 흡연자의 비율은
전국적으로 지속적으로 줄어드는 그래프가 보여지는데요,
서울시 그래프를 확대해서 보면
19년도와 20년도를 비교해보았을 때 17.8% -> 16.6%로 줄어들었어요.
이때 줄었다고는 하지만 감소 속도가 이전과 비교적 유사하다는 점에서 엄청난 인과관계가 있다고 추측하긴 어려워보이기도 해요.
가장 변화가 심하게 나타난 지표는 바로 중증도 신체활동 이에요!
정말 우리의 예상대로 19년에서 20년으로 넘어갈 때 중증도 이상의 신체활동 실천율이
눈에 띄게 낮아졌습니다.
19년도와 20년도를 비교해보았을 때 23.6% -> 19%로 줄어들었어요.
바깥 활동에 제약이 있다보니 집에서 할 수 있는 운동, 홈트레이닝, 일대일 - 소규모 PT가 유행인 것도 이와 연관이 있어보이네요.
이때 조금 흥미로웠던 점은
신체활동 실천율은 낮아졌지만 건강에 대한 관심이 커지면서 비만율은 오히려 낮아진 모습을 볼 수 있었습니다
이 외에도 일상생활 중 스트레스 인지율이 현저히 높아졌다던지,
우울감 경험율은 어떻게 바뀌었는지 등 다양한 결과들을 들여다보는 재미가
아주 쏠쏠했습니다 😋😋
그럼 저는 이제 PART 2로 돌아오겠습니다 ~
*해당 게시글은 Brightics 서포터즈 활동의 일환으로 작성된 포스팅 입니다.
게시글 관련 문의 및 소통을 원하신다면 아래 댓글로 남겨주세요
브라이틱스 사용 중 문의사항은
brightics@samsung.com으로 연락주세요 :)
'대외활동 > Brightics 서포터즈' 카테고리의 다른 글
[Brightics | 프로젝트] 서울시 건강 고위험 지역 군집화 (2) 계층적 군집화(Hierarchical Clustering) (0) | 2021.09.27 |
---|---|
[Brightics | 프로젝트] 서울시 건강 고위험 지역 군집화 (1) 나만의 위험군 지표 선정하기 (0) | 2021.09.21 |
[Brightics | 프로젝트] 결측치 처리의 모든 것 :: how to deal with missing value ? (0) | 2021.09.14 |
[Brightics | 프로젝트] 코로나19 이후 건강실태 변화 확인하기 :: 데이터 수집 + 로드 error 처리 (0) | 2021.09.07 |
[Brightics | 실습] 개인 데이터 분석 프로젝트 :: 주제 선정 w/ 지역건강조사 (0) | 2021.08.31 |