推荐系统实战第01课 推荐系统简介
推荐系统介绍(what why where)
Industrial Recommendation System
1、推荐系统是什么(what)
•分类⽬录(1990s):覆盖少量热门⽹站。Hao123 Yahoo
•搜索引擎(2000s):通过搜索词明确需求。Google Baidu
•推荐系统(2010s):不需要⽤户提供明确的需求,通过分析⽤ 户的历史⾏为给⽤户的兴趣进⾏建模,从⽽主动给⽤户推荐能 够满⾜他们兴趣和需求的信息。
•2020s?
**一种数学定义: **
-
设C为全体用户集合 n
-
设S为全部商品/推荐内容集合
-
设u是评判把 s i s_i si推荐 c i c_i ci的好坏评判函数
-
推荐是对于c∈C,找到s∈S,使得u最大,即
∀ c ∈ C , s c ′ = argmax ( u ( c , s ) ) s ∈ S \forall c \in C, s^{\prime}_{c}=\operatorname{argmax}(u(c, s)) s \in S ∀c∈C,sc′=argmax(u(c,s))s∈S
- 部分场景下是通过TOP N推荐
搜索 vs 推荐的区别
搜索引擎热力图和长尾理论图
2、为什么推荐系统越来越火?(why)
推荐系统存在的前提:
- 信息过载
- ⽤户需求不明确
推荐系统的⽬标:
- ⾼效连接⽤户和物品,发现长尾商品
- 留住⽤户和内容⽣产者,实现商业⽬标
推荐系统意义
1、对用户而言:
找到好玩的东西
帮助决策
发现新鲜事物
2、对商家而言:
-
提供个性化服务,提高信任度和粘性
-
增加营收 …
3、推荐系统需要做怎么做? (How)
根据用户的:
a) 历史行为
b) 社交关系
c) 兴趣点
d) 所处上下文环境
e) …
去判断用户的当前需求/感兴趣的item
4、**寻求解决信息过载的思路 **
- 之前解决相信过载的方式有:
分类导航页 => 雅虎
搜索引擎 => 谷歌,必应,度娘
-
但是,人总是期望计算机尽量多地服务
我们不愿意去想搜索词
希望系统自动挖掘自己的兴趣点
希望系统能给我们惊喜
-
推荐系统就在这种环境下产生的。目前有今日头条,虾米音乐,电商猜你喜欢,豆瓣…等等。
5、推荐系统结构
推荐系统评估
一、评估指标
•准确性 •满意度 •覆盖率 •多样性 •新颖性 •惊喜度
•信任度 •实时性 •鲁棒性 •可扩展性 •商业⽬标 •⽤户留存
用户的偏好的显示反馈和隐式反馈(Explicit vs Implicit)
1、准确性
**①准确性(学术界) **
评分预测:
打分系统 设 r u i r_{u i} rui为用户u对物品i的实际评分, r ^ u i \hat{r}_{u i} r^ui为预测分,则有如下误差判定标准
- 均方根误差
R M S E = ∑ u , i ∈ T ( r u i − r ^ u i ) 2 ∣ T ∣ \mathrm{RMSE}=\sqrt{\frac{\sum_{u, \mathrm{i} \in T}\left(r_{ui}-\hat{r}_{u i}\right)^{2}}{|T|}} RMSE=∣T∣∑u,i∈T(rui−r^ui)