본문 바로가기
그냥 생각난 것들/어쩌다 데이터

어쩌다 데이터 12 : 비데이터 직군의 데이터 역량

by 일말고프로젝트 2022. 9. 10.

0. 들어가며

 

최근 회사에서 기획자, PM 분들과 협업하는 프로젝트를 진행중 인데 몇 가지 정리해볼 것들이 생겼다. 데이터 분석가로서 PM, 기획자, 디자이너, 마케터 등 비데이터 직군에게 왜 데이터 역량이 요구되는지 생각해본 것들을 정리하고자 한다. 더해서 몇 번의 취업 멘토링을 진행하며 항상 받았던 질문인 '비데이터 직군의 데이터 역량의 범위'에 대해서도 개인적으로 생각해 본 부분을 정리해보겠다.

 

몇 번 안되는 경험이기 때문에 이렇게 정리하는게 시기 상조일 수 있다. 하지만, 이건 이것대로 연차가 쌓여서 다시 돌아봤을 때 의미가 있지 않을까 싶어 지난 경험들을 통해 느낀 점을 공유해본다.

 

1. 데이터에 기반한 기획의 실체

 

현재 진행하고 있는 프로젝트의 특성상 어쩌다 보니 기획자와 협업을 진행하고 있다. 현 프로젝트에서 기획자의 구체적인 역할은 사업/서비스 기획, 보고서 기획 및 작성 등의 '커뮤니케이션 및 보고 담당'이라고 할 수 있겠다. 하지만 일하다보니 기획자가 SQL을 조금만 할 줄 알았다면 1번만에 끝날 회의가 데이터 단순 추출 및 해석 공유 때문에 2번, 3번으로 늘어나는 안타까운 상황을 많이 경험하게 됐다. 단순히 SQL을 할 줄 몰라서 분석가가 데이터를 뽑아줘야만 일이 진행된다는 것의 문제 뿐만 아니라 사실 어떤 데이터가 어떤 형태로 있는지 모른다는 부분이 제일 답답했다.

 

어떤 데이터가 있는지, 그 데이터로 뭘 할 수 있는지, 그 데이터 분석이 뭘 의미하는지, 추가적으로 뭘 할 수 있는지, 성능은 어느정도 인지를 오직 분석가만 알고 있고, 추가 방향도 분석가가 정하다보면 결국 이런 생각이 든다.

쩝..

 

분명 함께 일하는 분들의 특성이나 연차, 업무 경험 등도 영향을 미쳤겠지만, 기획자의 데이터 리터러시의 역량이 얼마나 가치가 큰지 새삼 느낄 수 있었다.

 

2. 비데이터 직군의 데이터 역량은?

 

이번 경험에서 답답했던 이유는 내가 혼자 다한다는 빡침 뿐만 아니라 데이터에 관해 논의할 수 없다는 고립감도 컸던 것 같다. 다시 말하면 결국 문제를 해결하는 과정에서 데이터를 두고 여러 가설과 논의, 즉 핑퐁을 해가야 하는데 그저 일방향 전달을 하다보니 추출도, 분석도, 해석도, 기획도, 고민도 나만 한다는 느낌을 지울 수 없었던 것 같다

 

결국 협업을 위해서 필요했던건 단순 SQL 추출 역량, 시각화 스킬이 아니라 다른 데이터 역량이 기대되는 게 아닐까 싶다. 

흔히 데이터 리터러시라 일컬어지는 것에 대해 찾아보게 되었고, 내 경험에 빗대어 정말 간절했던 역량에 대해 정리해 보았다. 

 

1) 데이터로 할 수 있는 것

 

데이터로 할 수 있는 범위를 아는 것만으로도 많은 것들이 달라질 것 같다. 특히 데이터로 '할 수 있는 것'을 아는 것도 중요한데 데이터로 '할 수 는 있지만 해봤자 아무런 의미가 없는 것'을 알고 있다는 것은 많은 커뮤니케이션 비용을 줄여줄 수 있다고 생각한다.

 

일일 매출 합계 데이터만을 가지고, 재구매율을 구할 순 없다. 
일일 매출 합계 데이터를 활용해 다음날 매출 예측 모델을 만들 수는 있지만, 만들어서 쓸 데가 없다.
상권 기반 점포 매출 예측 모델을 만들 수는 있지만, 쓸 곳이 마땅치 않다.

 

2) 데이터가 할 수 없는 것

 

아무리 정교한 모델링을 통해 신규 고객을 발라낸다 한들 내미는 선물이 별 볼일 없다면 아무런 변화를 만들어 낼 수 없다.  카드 신규 가망 고객을 아무리 정교하게 추출한다 해도 카드 신규 발급 혜택이 백화점 상품권 5만원이라면 가입 확률은 극악에 가까울 수 밖에 없다. 극강의 높은 타겟팅 정확도로 고객에게 전달하는 상품이 전혀 매력적이지 않다면 사실상 아무런 의미가 없다. 이미 기획은 다 끝내고, 상품도 다 정해졌는데 모델링으로 부족한 점을 메꾸는 것이 가능은 하지만 절대 넘을 수 없는 벽이 있다는 것을 알아야 한다.

 

불행하게도 기획자가 데이터 분석을 통해 이 극복할 수 없는 것을 해결할 것이라 굳게 믿는 순간 꽤나 많은 노력과 시간을 날릴 수 밖에 없다.

 

3) 데이터의 의미를 이해하는 것

 

이 수치의 의미를 제대로 이해하는 것이 중요하다. 이 숫자가 평균보다 이만큼 높은게 어떤 의미가 있는지. 가격 분포가 왜곡되어 있는데 이게 의미하는 바가 무엇인지. 객단가가 높아지는게 어떤 의미가 있는지.

 

이렇게 중간중간 데이터 분석의 결과를 가지고 도메인 지식을 얽어내 해석해보는 것, 또 데이터 분석 결과를 가지고 새로운 가설을 세워보는 것이 정말 중요하다고 생각한다. 통계적 의미를 이해하고 받아들이는 건 두 번째가 아닐까. 결국 필요한 건 boxplot을 보고 카테고리의 상품 가격 분포가 Skewed 되어 있음을 이해하는 것보다 상품 가격에 따른 고객을 나눠보는 게 어떤지, 방문 횟수를 다시 분석해볼지 새로운 분석을 생각해보는 게 아닐까.

 

3. 맺으며

 

이렇게 정리하다보니 이제까지 많은 데이터 관련 멘토링을 해오며 가장 많이 받은 질문이 겹쳐서 떠올랐다.

비데이터 직군이 어느정도까지 데이터 역량을 쌓아야 할까?

아직 정확히 결론을 내려 가이드라인을 제시해주기엔 자신이 없지만, '데이터 역량'에 대한 이런 접근법은 어떨까.

 

'LGBM 모델링에서 그리드 서치를 통해 정확도를 높였다'라는 한 줄보다 어떤 문제를 풀기 위해 어떤 데이터가 필요한지 고민하고 해결해본 경험'
'데이터 분석의 결과를 가지고 새로운 가설을 세워 새로운 기획을 해본 경험'

 

이렇게 데이터로 문제를 풀기 위해 해본 자그마한 고민, 결과를 해석해 다시 새로운 가설을 세워본 경험처럼 데이터 리터러시를 강조하는게 더 매력적인 경험이 아닐까 조심스럽게 생각해본다.

댓글