대외활동/Brightics 서포터즈

[Brightics | 프로젝트] 코로나19 이후 건강실태 변화 확인하기 :: 시계열 자료 시각화

케이와이엠 2021. 9. 14. 14:00

저는 현재

"서울시 건강 고위험 지역 분류 기반, 포스트코로나 시대를 위한 현대인의 건강증진 방향 제시'

에 대한 개인분석을 진행 중인데요,

이번 시간은 분석의 첫 번째 PART의 핵심 !

현재 코로나19 이후 국민들의 건강실태가 얼만큼 변화하였는지를

데이터로 직접 확인해보도록 할게요 ➛➛➛

/* 속성 전처리 가이드 */

먼저 select column 으로 null 값으로 구성된 칼럼들(2008년 2018년)은 drop 해줍니다.

그리고 세종시의 2009,2010,2011 자료가 항상 누락되는 점을 확인할 수 있는데요,

이는 바로 세종시가 2012년 7월 출범했기 때문이겠죠 !

그래서 특정 값이 아닌 측정되지 않음을 의미하는 0으로 대체해줍니다.

이처럼 데이터 활용능력만이 아닌, 배경지식을 아는 도메인지식도 분석에서 정말 중요하게 작용한다는 점 !

이렇게 다른 데이터들도 동일한 방식으로 전처리 완료 !

/* 연도 데이터 시각화하기 */

연도 데이터를 시계열처럼 시각화하고 싶은데

만약 연도가 따로 따로 칼럼으로 지정되어 있다면 ?!?!

 

이렇게 알 수 없는 .. 이상한 그래프가 나오게 되죠 ㅜㅜㅜ

따라서 열로 지정되어 있는 연도를 행 안으로 넣어주면 될 것 같은데요,

이때 <unpivot> 함수를 쓰면 유용하더라구요 !

이렇게 새롭게 연도를 변수로 삼아서 year라는 새로운 칼럼으로 만들어주고,

해당하는 값들은 value라는 새로운 칼럼으로 묶어누는 !

즉, 행과 열을 바꿔주는 함수랍니다 !


이렇게 전환해준 데이터를 사용해서 chart setting을 활용해서

시각화한 결과를 공유해보자면

다음과 같아요.

먼저 고위험 음주율 같은 경우

전국적으로 보자면, 다소 엎치락뒤치락하는 모습이지만 2018년을 기준으로 꾸준히 낮아지고 있어요.

서울시로만 한정한다면, 그 모습이 더 선명이 확인되어 지는데요 !!

코로나 직전인 19년도와 20년도를 비교해보았을 때 13% -> 9%로 가장 급격히 줄어들었어요.

이는 아마도 코로나19 직후 사적 모임과 회식이 자제되는 분위기가 조성되었을 뿐아니라,

사전적 예방 조치로 유흥업소 운영제한과 가게들의 운영시간 제한 등의 정책 시행의 영향을 받은 게 아닌가 생각드네요 !

다음으로 흡연자의 비율

전국적으로 지속적으로 줄어드는 그래프가 보여지는데요,

서울시 그래프를 확대해서 보면

19년도와 20년도를 비교해보았을 때 17.8% -> 16.6%로 줄어들었어요.

이때 줄었다고는 하지만 감소 속도가 이전과 비교적 유사하다는 점에서 엄청난 인과관계가 있다고 추측하긴 어려워보이기도 해요.

가장 변화가 심하게 나타난 지표는 바로 중증도 신체활동 이에요!

정말 우리의 예상대로 19년에서 20년으로 넘어갈 때 중증도 이상의 신체활동 실천율이

눈에 띄게 낮아졌습니다.

19년도와 20년도를 비교해보았을 때 23.6% -> 19%로 줄어들었어요.

바깥 활동에 제약이 있다보니 집에서 할 수 있는 운동, 홈트레이닝, 일대일 - 소규모 PT가 유행인 것도 이와 연관이 있어보이네요.

이때 조금 흥미로웠던 점은

신체활동 실천율은 낮아졌지만 건강에 대한 관심이 커지면서 비만율은 오히려 낮아진 모습을 볼 수 있었습니다

이 외에도 일상생활 중 스트레스 인지율이 현저히 높아졌다던지,

우울감 경험율은 어떻게 바뀌었는지 등 다양한 결과들을 들여다보는 재미가

아주 쏠쏠했습니다 😋😋

 

그럼 저는 이제 PART 2로 돌아오겠습니다 ~

 


*해당 게시글은 Brightics 서포터즈 활동의 일환으로 작성된 포스팅 입니다.

게시글 관련 문의 및 소통을 원하신다면 아래 댓글로 남겨주세요

브라이틱스 사용 중 문의사항은

brightics@samsung.com으로 연락주세요 :)