推荐系统——(论文阅读笔记)YouTube的视频推荐系统

《The YouTube video recommendation system》是一篇详细介绍YouTube视频推荐的论文,在整个系统中没有复杂的算法,使用了一些简单有效的策略,这也符合工业界的应用,在工业界,为了考虑算法复杂度,数据量,可维护性等等一些因素,在工业界中,通常会选择一些简单有效的方法。


以下是论文的核心内容:

目标

帮助用户找到高质量且符合用户兴趣的视频,最终实现的是Top-N推荐。

总的思想

利用用户的互动行为数据,推荐与互动过视频相似的视频。

相似视频的挖掘

1、概念

相似视频指的是:当给定视频 v i v_i vi后,用户更有可能观看的视频组成的集合 R i R_i Ri,公式如下所示:

R i = f ( v i ) R_i=f\left ( v_i \right ) Ri=f(vi)

其中:

  • v i v_i vi:种子视频
  • R i R_i Ri:与视频 v i v_i vi相似的视频的集合

2、方法

关联规则(Association Rule)

计算与给定的种子视频一起被观看的概率,概率越大,相似性越高。

3、相似性的计算

计算的方法:

r ( v i , v j ) = c i j f ( v i , v j ) r\left ( v_i,v_j \right )=\frac{c_{ij}}{f\left ( v_i,v_j \right )} r(vi,vj)=f(vi,vj)cij

其中, f ( v i , v j ) f\left ( v_i,v_j \right ) f(vi,vj)称为正则化函数,通常可以取为: f ( v i , v j ) = v i ⋅ v j f\left ( v_i,v_j \right )=v_i\cdot v_j f(vi,vj)=vivj

计算出所有的与视频 v i v_i vi相似的视频,根据相似性的值 r ( v i , v j ) r\left ( v_i,v_j \right ) r(vi,vj)从候选集 R i R_i Ri中找到Top-N的相似视频。

( v i , v j ) \left ( v_i,v_j \right ) (vi,vj)可以表示成一个有向图,其中,权重为 r ( v i , v j ) r\left ( v_i,v_j \right ) r(vi,vj),如下所示:

这里写图片描述

生成推荐的候选

1、一级

假设种子集合为 S S S,由上述的相似性的方法挖掘出一些候选:

C 1 ( S ) = ⋃ v i ∈ S R i C_1\left ( S \right )=\bigcup_{v_i\in S}R_i C1(S)=viSRi

这里写图片描述

这样的方法容易产生narrow recommendations,即推荐的视频与种子视频相似度极高,这对推荐来说不能满足多样性的要求。

2、二级

以一级产生的候选 C 1 C_1 C1作为种子,产生 C 2 C_2 C2

C 2 ( S ) = ⋃ v i ∈ C n − 1 R i C_2\left ( S \right )=\bigcup_{v_i\in C_{n-1}}R_i C2(S)=viCn1Ri

这里写图片描述

3、多级

上述的结论推广至多级,形成最终的推荐结果为:

C f i n a l = ( ⋃ i = 0 N C i ) ∖ S C_{final}=\left ( \bigcup_{i=0}^{N}C_i \right ) \setminus S Cfinal=(i=0NCi)S

Ranking

ranking的指标主要有:

  • 视频质量
  • 用户特性

其他

  • 评价的方法:线上A/B Test
  • 评价的指标:CTR

参考文献

  • Davidson J, Liebald B, Liu J, et al. The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 293-296.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值