推荐系统笔记二:匹配算法和实践(part1)

本文介绍了工业界推荐系统的主要框架,包括Match和Rank两部分,重点讲解了协同过滤算法,包括User-based和Item-based CF的原理及优缺点。此外,还探讨了Model Based CF中的SVD和FM模型,强调了优化排序指标在推荐系统中的重要性。
摘要由CSDN通过智能技术生成

一:工业界常用的推荐系统框架

如YouTube2016年发表的论文Deep Neural Networks for YouTube Recommendations所示,在这里插入图片描述常用的推荐系统框架,主要分为MatchRank两部分:

  • 定义: Match基于当前的用户信息、历史信息、上下文信息(如用户所在位置等),快速在数据库中找到用户最感兴趣的TopN的Item,从而为后续的Rank来做小范围综合多目标最大化做准备;
  • 做法: 通常使用基于User/Item/Model-based CF、DNN-Embedding-based等等来做召回,做粗排之后交由后面的Rank层做更加精细的排序,从而最终得到TopN的Item;

二、Collaborative Filtering 算法介绍

CF就是收集许多其他用户的偏爱信息来对该用户的兴趣进行预测,从数学角度来看,就是一个矩阵补全问题,如下图所示:
在这里插入图片描述
如何补全上图中的问号处的值,许多算法应运而生:

  • User-based CF:基于用户的协同过滤可以挖掘那些有共同兴趣的小团体,通常具备一定的新颖性,但是准确性稍差,其典型公式如下: W u v = ∣ N ( u ) ∩ N ( v ) ∣ ∣ N ( u ) ∪ N ( v ) ∣ { {\rm{W}}_{uv}} = { {\left| {N\left( u \right) \cap N\left( v \right)} \right|} \over {\left| {N\left( u \right) \cup N\left( v \right)} \right|}} Wuv=N(u)N(v)N(u)N(v) N ( u ) N(u) N(u)表示用户u喜欢的物品集合,但是这个公式有个问题,比如对于热门物品,可能很多人都买过这个物品,那么就会导致用户交集变大,从而也导致了用户相似性变大,所以需要对热门物品进行惩罚,改进版本如下所示: W u v = ∑ i ∈ N ( u ) ∩ N ( v ) 1 log ⁡ ( 1 + ∣ N ( i ) ∣ ) ∣ N ( u ) ∣ ∣ N ( v ) ∣ { {\rm{W}}_{uv}} = { {\sum\nolimits_{i \in N\left( u \right) \cap N\left( v \right)} { {1 \over {\log (1 + \left| {N(i)} \right|)}}} } \over {\sqrt {\left| {N\left( u \right)||N\left( v \right)} \right|} }} Wuv=N(u)N(v) iN(u)N(v)log(1+N
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值