去年,在波士顿举办的第10届ACM推荐系统大会(ACM’s RecSys ‘16)上,来自Google的一个研究团队公布了YouTube推荐系统的深度学习论文:Deep Neural Networks for YouTube Recommendations
论文作者是Google的软件工程师 Jay Adams 与高级软件工程师 Paul Covington、Embre Sargin,他们向业界展示了YouTube在机器学习推荐算法上的深度神经网络使用情况。该论文涉及到一些非常技术、非常高级的细节,但它最大的意义是为我们完整描绘了YouTube推荐算法的工作原理!!该论文细致、审慎地描述了YouTube检索、筛选并推荐视频时的大量细节。
算法论文的UP主解析
YouTube工程师发布在ACM上的算法论文,目标受众显然不是我们这些UP主。但为了流量,阅读并理解该算法的内容,并让它来为我们UP主们服务就显得义不容辞了。接下来就看我们如何从UP主的角度来解析这篇算法论文。
在论文公布之前,我们上一篇分析YouTube算法的文章(详见AI科技大本营的译文:《想让视频网站乖乖帮你推内容?看看这位小哥是如何跟YouTube斗法的》),关注的主要是观看时长这一个因素,因为我们只能从自己上传的视频数据中来反推YouTube算法的工作原理,这肯定要受限于我们视频的内容和受众。我们之所以了解YouTube的算法,是因为我们解决了一下做视频路上碰到的这个问题:“为什么我们的视频就能这么成功呢?”为此,我们尽最大努力来分析已有的信息,但最初的结果并不理想。尽管我100%支持我们的结论,但我们先前的方法存在两大问题:
- 仅用频道指标的一部分来做反推,意味着我们在数据上存在巨大的盲点,毕竟我们无法访问竞争性指标、会话指标与点击率。
- 对于那些基于UP主的指标,YouTube算法所给的权重非常小。它更关心的是观众以及单个视频的指标。换句话说,该算法并不关心你所上传的视频,而是关心你和其他人正在看的视频。
但在我们写最初那篇文章的时候,YouTube或Google数年来都没公布过有关该算法的任何信息。所以,我们只