본문 바로가기
그냥 생각난 것들/어쩌다 데이터

어쩌다 데이터2 : 커리어 고민(기획이 재밌지만 코딩을 해야 한다)

by 일말고프로젝트 2021. 2. 11.

1. 잘하는 것과 하면 좋은 것

 

내가 한 걸 정리했으니 내가 하고 싶은 것과 잘하는 것도 정리해 봐야겠다.

 


기획이 재밌지만,

지금은 코딩을 배우는 게 이득이다. 

 

 

1) 기획 업무

어려서부터 재밌어라 했던 것들과 굵직하게 흥미를 갖고 꾸준히 해온 일을 보면 사람을 모아서 재밌는 프로젝트를 띄우고, 결과를 내는 일이었다. 방송 또한 케미가 맞을 것 같은 사람들을 모아서 내 기획을 만들어가는 재미가 쏠쏠했기 때문에 흠뻑 빠졌다. 방송의 꿈을 접고 보니 딱히 콘텐츠가 아니어도 사람들을 모아서 재밌는 일을 해내는 데에는 여러 방법이 있었고, 소소하게 재밌는 프로젝트를 띄워보고 있었다.

 

쓰다보니 좋아하기만 한거 같은데, 꽤나 성과가 잘 난 프로젝트들이 많았다. 여튼 사람 모으고, 새로운 업무를 만들어 내는 일은 재밌고, 꽤나 잘한다. 그리고, 자꾸 뭔가 새로운 걸 하고 싶어한다. 그때마다 머리가 알아서 돌아간다.

 

2) 코딩

 (1) 직업적 매력

백엔드, 서버 등의 흔히 아는 개발자의 공부를 해본 것은 아니고 데이터 엔지니어의 업무를 간접적으로 경험해 본 결과 코딩이 직업적으로 꽤나 매력적으로 보였다. 특히 데이터 커리어에서 코딩 실력은 필수 불가결..까지는 아니지만 실력 있는 사람이라면 꽤나 장착하고 있는 경우가 많았다. 그리고 데이터 세계에 와보니 어중간한 분석 실력과 어중간한 코딩 실력은 차별점이 없다. 차별점은 빠르고 정확한 데이터 핸들링 실력과 적재적소에 활용하는 분석 능력이라고 생각한다.

  (2) 흥미

아주 복잡했던, 그리고 비효율적으로 진행했던 업무를 최적화 하는 업무도 꽤나 재밌다. 자동화 프로그램을 구상하고 부분적으로나마 구현해보는 업무도 꽤나 재밌다. 음.. 정확히는 찾아내고 맞는 해결방법을 구상해 가상으로라도 가져다 붙여보는 게 재밌다. 그런데 물론 정말 열심히 해본 건 아니지만, 딱히 내가 잘하는 지는 모르겠다. 하다보니 뭔가 수학적인 측면 때문에 재미를 붙일 수 있을 것 같지만,, 꽤나 험난해 보인다.

  (3) 직업 생태계

워낙 빠르게 성장하는 커리어 생태계다 보니 정말 기상천외하고 엄청난 해결 방법들이 쏟아지는데 뭔가 끊임없이 성장하는 사람들을 멀리서나마 지켜 보면서 자극받고 나도 한번 구현해봐야지 이런 마음을 먹게 된다. 또한 문과의 다른 직무에 비해 비교적 이직이 쉬운 것 같다.

 

3) 데이터 커리어 로드맵

이젠 상대편을 정리해 봐야겠다.

데이터 데이터 하는데 사실상 데이터 커리어를 정확하게 들여다보고, 구체적으로 어떤 업무를 수행하는지 살펴봐야 한다는 생각에 여러 글들을 뒤진 결과를 정리해봤다.

 

 

https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%95%BC%EC%9D%98-%EC%A7%81%EA%B5%B0-%EC%86%8C%EA%B0%9C

 

 

현재로서 내가 접근할 수 있는 커리어는 아래 두 가지이다.

 

데이터 엔지니어(https://tech.kakao.com/2020/11/30/kakao-data-engineering/ 참고)

 

  • 서비스에서 생산된 데이터를 모을 수 있는 데이터 파이프라인 설계 및 구축
  • 데이터 핸들링 할 수 있도록 데이터 스트리밍 혹은 배치
  • logstash, fluentd 같은 수집기 사용, kafka, rabbitMQ 같은 MQ 사용, storm, flink, spark streaming 사용해 가공
  • 배치 처리는 hadoop MR, hive, spark 등을 사용하며 용도에 따라 다른 기술을 사용
  • Raw 데이터에 대한 일회성 분석
  • 시각화 툴을 활용한 일반 사용자를 위한 환경 개발

데이터 분석가(https://careers.kakao.com/jobs/P-10571 참고)

 

  • 전사 서비스 및 다양한 이슈에 대한 데이터 분석 및 인사이트 도출
  • 마케팅 효율 평가를 위한 index 개발
  • 객관적 데이터 분석에 기반한 경영진 의사결정 및 협업부서 문제해결 업무 지원
  • 트래픽 가치 극대화를 위한 유저 버킷 테스트
  • 비즈니스 모델 개발을 위한 데이터 분석

쓰고 보니 데이터 엔지니어는 내가 해왔던 업무와 꽤나 멀리 떨어져 있는 걸 알 수 있다. 데이터 배치 및 스트리밍을 위한 수집이라니.. 맨날 요청만 드리고 협조를 구하던 업무들이다. 물론, 어깨너머로 설명을 듣고 업무 방식을 이해하긴 했지만, 나와는 거리감이 있는게 사실이다. 

 

확실히 분석가에 있어 스스로 생각하기에 강점이 있고, 해왔던 업무이고, 하고 싶은 업무다. 내친김에 데이터 분석가라는 직무를 뽑는 기업들의 모집 요강을 정리해봤다. 

 

 

2. 데이터 분석가 필요 조건

내가 가고 싶은 기업들의 데이터 분석가 포지션의 모집 요강을 긁어서 정리했다.

 

기업 모집 직무 지원자격 우대사항
카카오 데이터 분석가 데이터 분석 업무를 수행할 수 있는 하나 이상의 언어 스킬 필수 (예. SQL, Python, R 등) 경력 3년 이상 혹은 능가할만한 무언가(실력/열정)
데이터 기반 프로젝트 경험이 있으신 분 (예: 통계 분석 프로젝트) 로그 수준의 데이터를 가공하여 분석 결과까지 도출할 수 있는 전체 분석 프로세스 유경험자
어떤 일이라도 중요하게 여기며 책임감 있게 진행할 수 있으신 분 Hadoop M/R, Hive, Spark 등 빅데이터 분석 플랫폼 사용 경험자
자신의 생각을 명확히 커뮤니케이션 가능한 분 관련분야 재직 이력 또는 학위(전산, 통계, 머신러닝, 수학, 알고리즘 등) 소유자
비즈니스 모델 개발을 위한 데이터 분석
쿠팡 business analysist 학사 학위 이상을 소지하신 분 이커머스, 리테일, 물류 관련 도메인 경험을 보유하신 분
Active한 데이터 분석 경험 최소 2년 이상이신 분 Python, R 등 기타 프로그램 언어 사용 경험을 보유하신 분
*SQL 활용역량 상급 이상 - SQL 라이브 코딩테스트 진행 예정 한국어 및 영어 모두 능숙한 커뮤니케이션이 가능하신 분
Tableau 또는 Power BI를 이용한 비즈니스 인텔리전스 리포팅, 대시보딩 경력을 보유하신 분
탐색적 문제정의와 체계적 사고체계를 갖추신 분
네이버 데이터 솔루션 기획 담당자 데이터 기반 서비스 기획/영업/성과분석 관련 경험 혹은 높은 이해도 보유 - 국내/외 커머스에서 데이터를 활용한 서비스를 기획/운영해 본 경험을 보유하신 분
- 캠페인 시스템 또는 사용자별 데이터 분석 시스템 개발경험 보유 - 데이터 서비스를 제공하는 업체에서 사용자별 니즈를 파악하고 서비스를
- 상품, 고객, 트렌드 분석 경험 3년 이상 ~10년 이하 직접 기획/설계/운영한 경험이 있으신 분
- 뛰어난 커뮤니케이션 및 문제해결 능력을 보유한 분 - 데이터 서비스 중심의 프로젝트 개발 경험이 있으신 분
- 새로운 업무에 대한 열정과 도전의식이 높고 빠른 수행능력을 보유한 분 - Tableau, Redash 등의 툴을 활용해 대시보드를 구현해본 경험이 있는 분
배달의민족 Business Analyst - 3~8년의 데이터 분석가 경력이 있는 분 - 숫자 기반의 논리적 추론 결과를 바탕으로 사업과 기술 측면에서 효과적으로 소통할 수 있는 분
- 데이터 분석을 통해 의미있는 인사이트를 도출해 본 경험이 있는 분 - 다양한 부서와 협업하며, 이해와 존중을 바탕으로 유연하게 커뮤니케이션이 가능한 분
- SQL을 활용한 데이터 추출 및 R, Excel 등을 활용한 데이터 분석이 능숙한 분 - 일의 처리과정을 효율화하고, 체계적인 프로세스를 설계해 본 경험이 있는 분
- 프로젝트를 주도적으로 수행해 성과를 낸 경험이 있는 분 - 업무적 성장을 위해 지속적인 노력을 기울이며, 팀과 함께 성장하고 싶은 분
배달의민족 데이터 분석 및 프로모션 기획 담당자 - 2년 이상의 서비스 기획 실무 경험을 보유하신 분 - 태블로, 리대시를 활용한 데이터 시각화 및 대시보드 구현 경험
- SQL 쿼리 작성 및 변형을 통한 데이터 추출이 가능하신 분 - 배달 프로세스(접수-조리-픽업-전달)와 관련한 데이터 분석 경험
- 오프라인 액션을 유도하는 프로모션의 기획-분석-개선 경험을 보유하신 분 - 동종 또는 유사 서비스에서 PO/PM, 기획 경험을 하신 분
쿠팡 Data Analyst • 데이터 분석 관련 경력 최소 4년 이상 • 통계, 수학, 컴퓨터 공학, 데이터 관련 분야 학.석사학위 소지자
• 데이터 분석 프로젝트를 도입하고 이끌어 실행 가능한 인사이트와 권고사항을 만들어본 분 Tableau, Grafana, 혹은 유사툴을 이용한 GUI 기반 리포트 작성 경험
SQL숙련자 • 리테일/이커머스 경험
• 원활한 프리젠테이션/커뮤니케이션 능력 • Python 라이브러리, 스파크, R 및 Github, Airflow 등 데이터 분석 경험
• 통계 분석과 알고리즘 디자인 경험자 • 비즈니스 영여 가능자
토스 Data Analyst 모바일 서비스 데이터 분석 방법(LTV, AARRR, Cohort, Funnel 등)에 대한 높은 수준의 이해도가 필요합니다. 적재 기간이 10년 이상인 데이터셋을 정제/분석하여 Insight를 도출하고, 이를 통해 성과를 낸 경험이 있는 분이면 좋습니다.
SQL을 사용한 Raw Data 핸들링 역량이 필요합니다. Python, R, Spark 등을 활용한 데이터 프로세싱에 대한 이해도가 높으신 분이면 좋습니다.
IT/모바일/금융 업종에 대한 높은 이해도와 데이터 분석 경험이 필요합니다. 통계학, 금융공학, 예측 모델링 관련 석/박사 학위를 소지하셨거나 해당 분야에 대한 경험이 많으시면 좋습니다.
분석 결과물을 적시에 간결한 언어로 전달할 수 있어야 합니다. Data Warehouse 구축 지식이나 경험이 있으면 좋습니다.
비즈니스 시나리오별 시뮬레이션을 통해 액션을 제시하실 수 있는 역량이 필요합니다. 데이터 시각화(Tableau, Grafana 등)에 대한 경험이 풍부하시면 좋습니다.
복잡하고 다양한 데이터 셋을 정제하여 서비스의 문제를 진단하고 해결하는 역량이 필요합니다.

 

정리하고 보니 정량적으로 필요한 스펙은 #파이썬 #SQL #경력 3년 이상 #데이터 시각화 경험 으로 볼 수 있겠다.

 

1) 경력 3년 이상

 

현실적으로 먼저 부딪히는 문제는 경력 3년 이상의 조건이다.

실무 관점에서 생각 해보면 사실 당연한 조건이다. AD-HOC이나 필터링 업무같은 단순 데이터 핸들링 역량에 그치지 않고, 비즈니스 관점에서 데이터를 다뤄봤는지가 중요한 것 같다. 아마도 아래 역량을 3년 이상이면 어느정도 쌓았겠거니 추정한 게 아닐까 싶다.

 


비즈니스 시나리오별 시뮬레이션을 통해 액션을 제시하실 수 있는 역량

데이터 분석 프로젝트를 도입하고 이끌어 실행 가능한 인사이트와 권고사항을 만들어본 분

프로젝트를 주도적으로 수행해 성과를 낸 경험

탐색적 문제정의와 체계적 사고체계를 갖추신 분

데이터 기반 프로젝트 경험이 있으신 분

 

 

 

이 부분은 사실 업무 환경적인 측면도 같이 고려를 해봐야 한다. 정확히는 어떤 회사인지, 더 정확하게는 회사의 데이터 업무가 어떻게 진행되는지, 내가 클 수 있는 회사인지. 이부분은 조만간 이직과 재취업으로 다시 다뤄 봐야겠다. 일단 담백하게 위 역량에 대한 경험은 말 그대로 경험 해보는 수밖에 없겠다. 현재 하고 있는 프로젝트에서 최대한 많이 배우고, 올 기회들을 잡아서 최대한 많이 실험해 보는 수밖에 없겠다.  

 

2) SQL

사실,, 뭐 해달라는 SQL은 웬만하면 뽑을 수 있는데, 꽤나 허덕인다. 할 순 있는데 잘 하진 못한다. 내친김에 제대로 공부도 할 겸 전부터 따려 했던 자격증 공부하면서 정리좀 해 둬야겠다. 

 

22일에 바로 신청가자!!

 

3) 데이터 시각화 경험

(1) 시각화 기획 

언제 어떤 시각화를 어떻게 할 지 기획하는 업무 경험이 필요하다. 워낙 많은 EDA 라이브러리가 있고, 구글링만 하면 리포트 수준으로 구현하는 것들도 많은데 결국 차별점은 타이밍과 적합성이다. 사실 진행하는 업무 중에 대시보드 관련한 업무가 있긴 하지만 엄밀히 시각화가 아닌 시각화 기획, 화면 CS에 가깝다. 업무를 인수인계 받으며 대충 리포트마다 로직을 간략하게 훑어 보긴 했지만, 대시보드 내 리포트 별로 구성과 분석 레벨, 작동 원리 등으로 세분화 해 다시 공부하며 시각화 기획 측면을 정리해 놔야겠다.

 

(2) 시각화 스킬

시각화 스킬은 Kaggle로 커버 할 수 있지 않을까 싶다. 수많은 EDA 라이브러리를 쓸 때마다 아카이빙만 해놔도 어느정도 자산이 될 것 같다. 

 


이 정도까지 잘 하는 것과 하면 좋은 것을 정리했으니 다음 번에는 하고 있는 것과 해야 할 것을 정리해 봐야겠다. 

댓글