본문 바로가기

프로젝트(진행중)/머신러닝 한 걸음씩8

실무에서 추천 시스템을 만들어 보며 느낀 것들 혼자 개발 + 처음 기획자와 협업 + 서비스 적용 경험을 기억하며 1. 추천 시스템의 목적은 생각보다 다양하고 중요하다. 2. 객체화를 안해도 되는 것 같지만 안하면 나중에 뒷감당이 안된다. 3. 구글링 복사 붙여넣어서 돌아가게 하는 것도 실력이다. 4. 구글링 복사 붙여넣기도 원리를 이해해야 가능하다. 5. 충분한 사전조사 없이 구현부터 하다가는 시간 낭비할 확률이 높다. 6. 누구에게 모델을 설명하는 일은 아주 어려운 일이다. 7. RMSE가 아닌 Metric을 설명하는 건 더더욱 어려운 일이다. 8. 이 모델보다 성능이 좋은 모델들은 셀 수도 없이 많다. 9. state-of-the-art에 현혹되면 토끼굴에 빠지기 쉽다. 10. 주석은 나를 위해서 다는 것이다. 11. 단계단계마다 왜 해야 하는지.. 2022. 4. 17.
추천 시스템 정리 1. 추천 시스템 개요 1) 프로세스 데이터베이스 내 상품의 평점, 구매, 리뷰 등을 포함한 데이터가 저장되어 있다. 유저가 추천을 요구하면 추천 로직에 의해 이 데이터들을 사용해 후보 상품을 추출하고 후보 상품의 평점 혹은 선호도를 예측한다. 이후 가장 높은 순위의 상품을 정해진 개수만큼 추천한다. 이 추천들은 어떠한 방법의 UX를 이용해 사용자들에게 노출된다. 사용자들은 이 추천들에 대해 액션을 취하고 이 액션은 피드백으로 시스템에 주어진다. 이 피드백들은 추후에 사용될 추천들에 영향을 준다. 2) 자주 사용하는 용어 비개인적 /정형화된 Best, top-selling 대중적인, 그룹이 모두 좋아하는, 개인의 선호도와는 상관 없는 추천 연관성 Association Rule, Basket Analysi.. 2022. 2. 21.
Accuracy(정확도), Recall(재현율), Precision(정밀도), F1 Score 총정리 모델을 짰으면 그 모델이 얼마나 잘 작동하는지 확인해야 하고, 그때 여러 지표를 확인한다. 대표적인 4가지 Accuracy(정확도), Recall(재현율), Precision(정밀도), F1 Score의 개념부터 장단점까지 한번 정리해보자! 1. Accuracy(정확도) 내가 예측한 건들 중에서 정답을 맞힌 건수의 비율이다. 수식으로는 이렇다. 단점 : 정확도의 역설 Negative의 실제 비율이 너무 높아서 희박한 가능성으로 발생할 상황을 제대로 분류하지 못하는 경우가 생길 수 있다. 예를 들어 내일 운석이 떨어질지 여부를 예측한다면 100%가까운 정확도를 아무런 모델 없이 만들 수 있다. Negative만 예측하는 모델을 만들면 Accuracy는 높을 수 밖에 없다. 이럴 경우를 대비해서 필요한 지표.. 2021. 10. 5.
EP 05. RNN부터 LSTM까지 이해하기 1 개념은 이 블로그를 참고했다. https://dgkim5360.tistory.com/entry/understanding-long-short-term-memory-lstm-kr Long Short-Term Memory (LSTM) 이해하기 이 글은 Christopher Olah가 2015년 8월에 쓴 글을 우리 말로 번역한 것이다. Recurrent neural network의 개념을 쉽게 설명했고, 그 중 획기적인 모델인 LSTM을 이론적으로 이해할 수 있도록 좋은 그림과 함께 dgkim5360.tistory.com 개념 요약 1. RNN은 비교적 짧은 시간 전의 정보를 기억해 모델에 활용하지만 긴 시간 이전의 정보를 기억하긴 쉽지 않다. 2. LSTM은 긴 시간 이전의 정보도 잘 기억하고 이를 잘 활용.. 2021. 9. 22.