推荐系统之雅虎图文:Embedding-based News Recommendation for Millions of Users

前言

  雅虎日本2017年发的他们的推荐系统paper,主要以Emebdding作为用户和文本新闻的表示方式,来让我们师夷长技以自强下。

亮点

  主要就是在倒腾各种Embedding,用来做推荐。
  1)用降噪自编码实现文章的 embedding e m b e d d i n g
  2)用RNN学习用户行为的 embedding e m b e d d i n g

YaHoo日本的图文推荐处理流程
  1. Identify 获取用户特征 Vu V u
  2. Matching 匹配候选新闻集合。
  3. Ranking 对候选集排序。
  4. De-duplication 根据新闻相关性去重。
  5. Advertising 插入广告。

notice-1: 在上述1,2,4的地方用到了Embedding表示的用户和新闻。
notice-2: 在第2点上并没有说清楚是从所有新闻中匹配候选集,还是有个所有新闻的子集来做匹配。
notice-3: 在最终展示顺序上,以排序为基础,辅以额外的影响因素,比如新鲜度(hot),相似新闻不近邻(diversity)等。

为什么Eebedding

1) 协同过滤和低秩分解类方法的先天缺陷
  不适应更新很快的系统,只消耗旧数据 ,无法对新数据产生足够快的响应。基于词的推荐,则容易受限于词自身的语义缺点,比如同义词的不同词容易推类似新闻。图文推荐系统的特点,不同于广告和视屏,图文新闻过期很快。
2) 用户的行为历史的顺序及结构信息,没有被充分利用起来。
  基于上述两点,分别用改进的降噪自编码对文章作表达,用RNN方法对用户作表达。来完成以下三点推荐要素:
 1. 理解文章内容。
 2. 理解用户喜好。
 3. 为个体用户选择新闻并排序。

Artical Embedding

  基本模型是denoising autoencoder,对其加上弱监督学习作改进,以提高hiden-layer-embedding对差距的表达能力

x˜nq(x˜n|xn)
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值