二、推荐系统包含哪些环节
推荐系统要解决的挑战是:怎样从海量的内容中,挑选出用户感兴趣的条目,并且满足系统50MS~300MS的低延迟要求?
- 系统需要在50毫秒~300毫秒内进行返回:
- Netflix要求99%的请求在250毫秒内返回
- 今日头条大概是200毫秒
为了解决这个问题,业界会将推荐服务分为3个环节:召回、排序、调整
1、召回:有两个主要的职责
- 实现巨量的数据降低,比如说亿级别到万级别
- 选取和用户直接相关、间接相关的很粗略的个性化内容
- 使用方法:协同过滤召回、内容相似召回、图算法召回、热门召回、新课召回等等
- 要么是和用户相关,要么是系统强推的条目,比如说热门条目、新的条目
召回的策略很多,几十种、上百种。有时候,一个新的推荐系统的效果往往取决于召回这一步所做的事情。
召回结束之后,得到的数据是成万或者上千的,然后进行下一步排序环节