본문 바로가기
프로젝트(홀딩)/유튜브 댓글분석

두 번째 프로젝트 : 댓심 프로젝트

by 일말고프로젝트 2021. 3. 31.

두 번째 프로젝트로 댓심(댓글 + 민심) 프로젝트를 시작해보려 한다.

 

1. 배경

(1) 나의 경험

예전 스타트업에서 일할 때 유튜브 댓글과 고객들의 후기 데이터를 근거로 영상을 기획한 적이 있었다. 단순한 텍스트 마이닝으로 키워드를 추출해 이를 참고하는 방식이었지만, 정량적인 근거를 토대로 영상을 기획해본 경험이 인상적이었다. 

 

몇 년전 영화 홍보영상을 제작할 기회가 있을 때에도 써먹었던 방법이었다. 댓글을 있는대로 다 긁어 무식하게 키워드를 뽑아내 해석해보니 영화에 기대하는 부분, 장면, 감동적인 포인트를 얼추 유추할 수 있었고, 토대로 영상의 포인트를 기획했었다. 영상을 제작한 후 피드백을 해봤을 때에도 의도했던 부분이 먹혀들었던 것 같다.

 

(2) 트렌드

최근 유튜브 영상을 시발점으로 재밌는 현상들이 많이 보인다. 특히 유튜브의 댓글을 토대로 밈이 만들어지거나 레전드 댓글, 댓글 모아보기 등 새로운 콘텐츠가 발생하는게 인상적이었다. 댓글을 다는 심리도 재밌고, 그 대댓글, 좋아요수를 많이 받는 댓글 등의 재생산되는 콘텐츠도 재밌어 보였다.

 

댓글모음 영상이 심심찮게 보인다

 

댓글의 힘이 주목받으면서 유튜버들에게도 가려운 곳이 아닐까 싶었다. 상위 노출, 썸네일 제작, 영상 기획, 편집 기술 같은 테크니컬한 부분이 아니라 구독자들의 목소리를 가장 자세히 들을 수 있는 곳임과 동시에 조회수, 좋아요, 채널의 방향을 설명할 수 있는 단서가 모여있는 곳이니 흥미롭게 다가올 것 같다.

 

2. 내용

 

사실 크롤링 하는 방법은 정말 많다.

 

끌어다 쓰고 싶다 ㅠㅠ

결국 크롤링, 마이닝의 차별점 보다는 어떻게 데이터를 분석하고, 해석하고, 적용할 것인지에서 재밌는 걸 찾아내고 싶다. 구독자는 고객, 유튜버는 제조사, 영상이 상품으로 가정해 여러 방법론을 적용해볼 예정이다. 특히 유튜버 관점이 아니라 구독자 관점, 즉 고객 관점에서 분석해보면 재밌는게 많이 나올 것 같다. 

 

 

간단하게 말하면 유튜브 영상에 달린 댓글들을 분석해 해당 채널의 특성을 파악 해보고, 시청자들은 콘텐츠에 어떤 반응을 보였고, 또 어떤 것을 원하는지 확인해보고자 한다. 또한, 유튜버의 키워드와 얼마나 일치하는지도 확인해본다. 특히 댓글의 긍부정, 추출 주요 키워드, 대댓글 등과 조회수 및 좋아요의 상관관계도 확인해보면 재밌을 것 같다.

 

가능하다면 고객을 식별하는 것처럼 시청자를 식별해 영상별 댓글 작성 여부로 클러스터링을 해보면 재밌을 것 같다. 마치 구매주기 처럼 고객관점에서 바라본 영상 시청 주기나 영상 선호도에 따라 구독자를 묶어볼 수 있지 않을까?

 

3. 방법

크롤링 프로그램을 제작하기 전에 어떤 데이터가 필요한지 정의하고, 또 그전에 무엇을 분석할지 정의하고, 어떤 방향성을 가지고 시작하는지 정의한다.

 

1) 방향성

이 세 가지 의문을 가지고 진행해본다.

 

채널 내에서 상대적으로 댓글 수가 많은 영상은 어떤 영상일까?
구독자들은 무슨 이야기를 하고 있을까?
유튜버는 구독자들의 이야기를 잘 반영하고 있을까?

 

2) 데이터 수집

수집해야 하는 데이터는 영상별 댓글 수, 영상 키워드, 댓글 내용, 작성자, 일시, 댓글 좋아요 갯수이다.

 

3) 분석 방법

구독자들은 무슨 이야기를 하고 있는지에 대한 분석이 주를 이룰 것 같다.

이를 위해선 감정분석, 키워드 추출, 댓글과 뷰 수의 관계 등을 확인할 예정이다.

셀레니움 활용하지 않을까 싶다. 저번에 업무 중에 제작했던 이커머스 리뷰 크롤링 프로그램을 기반으로 만들어볼 예정이다. 직접! 만들어봐야겠다. html 공부도 할겸.. 텍스트 데이터 분석은 kakao의 pororo를 적극 활용해볼 예정이다. 안되면 끼워맞춰서라도:)

 

github.com/kakaobrain/pororo

 

kakaobrain/pororo

PORORO: Platform Of neuRal mOdels for natuRal language prOcessing - kakaobrain/pororo

github.com

 4) 결과 시각화

   : 유튜버 입장에서 생각해보고 중요한 지표를 먼저 정의한 후에 시각화 대상을 선정해야 한다. 비즈니스 대시보드 만드는 것처럼 진행 해볼 예정이다.

 

4. 주요 포인트

 (1) 기술적 부채를 지지 말자!

 (2) 정량적 분석 뿐 아니라 정성적 분석에 초점을 맞춰보자!

 (3) 테스트 케이스까지 진행해보자

 

 

 

댓글