선정 이유: 내가 살면서 겪은 가장 강력한 추천 시스템 , 중국에 경우 100% 개인화 뉴스앱 가입자 6억명(~개인화된 네이버)

[이코노미조선] 100% 개인 맞춤형에 가입자 6억명...대형 언론사 쓰러트린 중국 뉴스앱

0.요약(Abstract)

1. 개요(Introduction) : 실제로 딥러닝을 통해 서비스의 성능을 개선시킴

  1. 실제 상황에서 겪게되는 이슈들
    1. Scale : 엄청난 양의 데이터와 제한된 컴퓨팅 파워 → 고도로 전문화된 분산 학습 알고리즘과 효율적인 서빙 시스템이 필수적
    2. Freshness : 새로운 컨텐츠의 빠른 적용이 필요함. → 초당 몇개가 업데이트되는 상황에서 반영할 수 있어야함.
    3. Noise : 낮은 meta data 퀄리티(sparse , many external factors) , Implicit Feedback(시청 이력) 위주 데이터 → 이러한 특정 특징에 강력한 알고리즘 필요.
  2. 구글이 사용하는 보편적인 대규모 분산 딥러닝 모델(2012, Large Scale Distributed Deep Networks)https://proceedings.neurips.cc/paper/2012/file/6aca97005c68f1206823815f66102863-Paper.pdf
  3. (sementic segmentation 의미분석) (2016, TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems)

https://colab.research.google.com/github/tensorflow/models/blob/master/research/deeplab/deeplab_demo.ipynb#scrollTo=aUbVoHScTJYe

2. 전반적인 모델 설명 (System overview)

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/db70744b-dfd4-4524-8b73-01c87ac86547/스크린샷_2021-07-27_오후_6.30.41.png

  1. Candidate Generation Model : High-precision 이 목표
  2. Ranking Model : 다양한 다른 소스들의 적용을 통한 성능 개선