假如让我来设计“腾讯视频”的推荐系统

作者·黄崇远

『数据虫巢』

全文共4966

题图ssyer.com

 虽然我一向警惕被推荐系统带着走,但我也讨厌低效。

这是一个带着故事背景的技术话题,轻松愉快但又不乏对于技术深度的思考。

01

故事背景

作为一个拥有二娃的三十多岁中年老男人,岁月早已磨光了我对游戏的激情,想当年我也是天梯1800分的选手,DOTA玩的老溜了。

但岁月无情,残废了我的手,消退了我的意志,竟然沦落到简单AI电脑都打不过了,所以,偶尔的闲暇时光,看看电影竟成了我唯一的娱乐消遣方式。

但是。

笔者作为腾讯视频多年的VIP付费会员,不得不说一句,腾讯视频真的太难用了。

首页都是什么鬼,一票的什么热门视频,什么原创,什么娱乐综艺,总之,90%都可能是我一辈子都不会打开的类型。

于是乎,片库和检索成了我的主要获取影片的方式,但是...人的认知是有限的,片库的片源看着也是有限的,但对于我来说就是无限的,看不过来也不知道到底讲啥的(反正有点名头的应该都看过了,剩下都是未知项)。

不可否认的是,通过这种摸索探索的方式,确实被我找到不少之前不知道但是确实还可以的影片,但这个过程太痛苦,试错成本蛮高的。

他就不能搞个推荐系统吗?如果让我来设计这么一个推荐系统...

02

先吐槽几个点再说

笔者不确认腾讯视频是否有推荐逻辑。

首先首页的跑马灯中“猜你会追”应该多少是个性化的,但观测下来大部分是根据之前的播放记录(没看完的之类的),甚至是已经看过的还一个劲儿放上去,反正挺辣眼睛的,这个模块还不如放个播放历史记录呢,没劲。

剩下首页满满的各频道,各类别放了一些所谓的精挑细选的,大概率是非个性化的,如果有,我只能说做的太一言难尽了。

播放页,下面有个为你推荐栏目,目测是个性化的。

不清楚具体的推荐逻辑,但目测在内容相关上做了不少事情,这些都不是重点,重点是以上面截图为例,上面总共推了14个,其中11个我都看过了,你还推个毛啊。

长视频领域是属于典型的短时间内不会重刷剧的场景,你这样搞让我很为难呀。

实现这种去重很难吗,我不是专业搞工程的,但想来不是很困难的,无非就是维护一个用户的已播放队列,甚至是播放进度都可以缓存下来。

再再再做的差一点,好吧,没有服务器资源,你把有登录状态的播放历史记录在本地都行了吧,我不指望你跨设备能识别我已经看过的,最起码同个设备启动应用的时候加载播放过的记录,避免这种二货行为很难吗?

他难不难不知道,反正我是感觉我太难了,要不是看重他片源版权多,我早就放弃抵抗了,用的实在太辛苦了。

03

推荐的产品必要性

从上面的吐槽部分来看,腾讯视频不是一个偏推荐系统逻辑的产品逻辑(至于为什么,感觉更多是基因吧,或者做产品的核心方法论,跟头条是另外一条路子,虽然我很不认同这个路子)。

所谓推荐系统逻辑的产品逻辑,听着有点绕,笔者说个产品形态就容易理解了,今日头条。或者其下面的相关产品,都是典型重度依赖于推荐来做内容与流量的分发的。

本质上推荐逻辑形态和重产品逻辑的形态其实是两种打法,但笔者认为本质上是对人的理解。

产品思路的打法,核心是识别主动型和被动型主体,或者说再加上时间因素,什么人什么时候是主动型需求,什么时候是被动型诉求。

主动型的选手,其在产品逻辑上,可能更多期望的是一种固定的逻辑,给予其更多的自我空间,去探索和自己寻找需要的东西。

而被动型的选手,更多在于其获取信息的能力是有差的,又或者说人力终归有时尽,比如笔者个人,从某种程度上说获取信息的能力应该比95%的人都强,但很多时候一样非常无奈,毕竟人的认知是有限的。

而为什么说要加上时间因素,依然如笔者,可能很多时候我自己通过检索,通过其他工具我已经明确知道我需要看什么剧看什么电影,但很多时候我也希望能够找到我所不知道但又是恰巧我所喜欢的电影,只是不希望这个找的过程太过于闹心。

所以,当主动型占据权重过大的时候,整个形态重产品逻辑,当被动型的时候重推荐逻辑,不冲突,各取所需而已。

笔者自身,对于推荐类的产品有天然的抵触心理,并且常常违背推荐逻辑进行产品逻辑体验,属于推荐模型中的典型脏数据。

总结下来就是,看菜下饭,各取所需,平台需要尽量做到千人前面,这里所谓的千人千面就不单纯指推荐系统中的千人千面,还包括上述所说的可能有些人就是喜欢这种严谨风,非个性化风,那么你给他呈现的就是这种非个性化的内容并且罗列整齐的内容,这也是一种个性化。

给喜欢或者有需求的人个性化的内容,给不喜欢个性化的人也是“个性化”的内容。

04

推荐的策略

说完了潜在的必要性,现在来聊聊怎么做策略,甚至深入到怎么做模型,毕竟咱们是做数据做算法的嘛,看个视频也得看出花来。

其实整个视频领域,特别是长视频领域,还是非常有迹可循的。

所有的产品形态记住一个推荐逻辑,越是需要决策成本的场景,其中长期的兴趣捕获就越重要,比如长视频领域,你看一个电影需要“浪费”你2个小时,这意味着一旦你选错了,可能你看了30分钟之后,终于发现你丫的一点都不喜欢这个影片,这意味着你真的浪费了30分钟。

这就是决策错误的成本,因此,大部分时候这种决策不会是一时兴趣,而是中长期的行为习惯的最终决策,毕竟浪费30分钟够你刷多少个抖音视频了。

所以,回到中长期兴趣的话题,重点是挖掘中长期兴趣点,这个先放放。我们来看下,长视频还有哪些特点。

列一下电影的几大要素,导演、主演、类型、话题等,这些都是中长期形成的兴趣认知。

但又有所不同,导演主演是长期认同,是有前置认知的,比如我喜欢看黄渤的电影,是因为之前看过他的电影,形成了“这个演员演的电影应该靠谱”这种中长期的认知。导演维度同样。

而类型则不同,他是一个大的概念,是一种界限分明的兴趣点,一定是有规律的,没有人所有类型通吃的。比如笔者,对于科幻、超级英雄、动漫、纪录片、动作片、灾难片之类的有一定的认知度,虽然不是说这些类型的电影都喜欢,但起码喜欢的电影大部分都在这些类型里。

除此之外,比如什么爱情片、恐怖片、文艺片就不是我的菜了,虽然也看一些,但整体上是非常少的。

关于类型,其实衍生下去就是话题,这是比类型更细的兴趣聚合点,比如三国题材,他可能是大型战争,也可能是历史,也可能是剧情等。

再衍生下去就是系列,比如漫威系列,钢铁侠系列等等,太多了,这种是有天然的强联系的。

如上都是非常明显的挖掘点,再说下不明显的挖掘点,那就是很多时候要素之间是互斥的,典型如笔者的操作逻辑,对于我所喜欢的主演,我大部分是不挑题材和话题的;对于没有名主演或者我所不熟悉的导演主演,我对于剧情的细节会更加扣,又或者是热度等驱动因素在里头起着很大的作用;对于同题材或者同系列,在体验良好之后,挖掘持续的内容是一个常态;时间是一个典型的类型,具有明显的分界线。

所以,在选择内容的时候,其实很多时候做决策的是其中一个因素,但是这种因素之间是有先后顺序的,甚至很多时候是互斥的,但难点在于系统需要知道什么内容对于目标来说,其哪个核心因素在起作用,抓住这个核心因素进行有效内容的呈现。

其实不用说太多,上面这些做好了,已经能解决很大一部分问题了,大部分把常规兴趣就能捕获住了。

那么,那些策略可验证吗?我觉得太好验证了,例如系列的问题,分析一下历史数据就知道这种系列的追溯程度了。对于主演和导演的因素,追溯一下检索的记录就知道了。

这些逻辑都是可以验证的,提出假设,在历史数据中寻找答案。

05

关于推荐的模型

上面说了一些常见的策略,这里聊一些偏模型的东西。

关于目标的兴趣预测,大部分常规逻辑是挖掘用户的特征,然后构建预测模型,然后对用户进行兴趣预测,然后在对应场景推荐合适的ITEM,然后打完收工。

但是,长视频平台是一个比较特别的场景,回到上面章节,有提到过,长视频平台是有决策成本的,特别是在各大平台争相变相让你付费VIP之后(不VIP就让你看广告看到吐),这种成本变得更高了。

这就导致了,目标主体其实是一个多目标,即家庭成员共享账号。典型如笔者,自己和梓尘兄共享账号,我看我的大电影,他看他的动画片和火车视频。

但这俨然就是两个完全不同的兴趣列表,两个完全不同的目标群体,对于预测来说是个挑战。方式一就是分开建模,有没有办法将行为区分开来,然后再分开建模?

还是回到上个章节中的决策成本的问题,这意味着长视频平台注定就是一个低频,但是单次时长较长的场景,这就意味着不同目标主体之间的活动时间一定是有规律的。

依然回到笔者自身,例如笔者平时是没有时间看的,最多中午时间偶尔,周末时间偶尔,对于梓尘兄只要是白天非周末时间基本上不太可能是他在使用,除此之外就是观看的内容本身关联度是非常小的。

基于上面,一个是拆分行为分开建模,另一种就是把能够典型区分的行为作为典型特征加入训练,例如上面说到的观看时间,甚至是星期几。

需要注意的是,在模型中,需要尽可能的让这种显著特征不要泯灭于茫茫特征之海中,是不是想到了什么?

对的wide&deep,一定要把这种显著逻辑放到离目标近的地方,万万不要把他丢到成千上万的深度参数中。

第二个典型问题,正负样本的问题。

依然是决策成本的问题,由于长视频观看一次成本还挺高的,所以其任何观看过程中的行为对于目标预测都是有意义的。

例如播放过程中是否看完,是否快进,对于系列是否持续追踪,这些都是对正样本有加权作用的,反过来看到一半看不下去的,后面没有续上的,典型就是负例了。

但负例的情况有点特殊,那就是他为什么会点开这个视频,他为什么又会放弃掉这个视频。这就需要我们从点开的动作中捕获到其触发的兴趣点,然后从已播放的内容中挖掘中放弃的核心触动因素。

还是以笔者举例,我曾放弃对于导演主演的追求,尝试去看一些看着感兴趣主题的自制网络大电影,但最终却让我养成了对于自制网络大电影持长期怀疑态度。这就是我已经形成了对于网络大电影这个要素持反对的态度了,对于任何类似的内容都持有非常谨慎的选择态度。

是否可以验证?也是可以的,将这种节点获取出来,然后统计其后的行为即可,可以验证这个逻辑。

回到策略这个逻辑中,我们知道我们选择一个电影,很多时候其实就是一个触动点,导演?演员?主题?系列?热度?等等,所以本质上对于不同的特征其决策权重是不同的。

想到了什么?是的,注意力,如何能够精准的把握住不同特征之间的注意力非常主要,至于是不是用attention,这个就是实现方式的问题了。

06

商业行为的考量

这个部分,我们回到商业问题的讨论,任何所谓的推荐系统也好,非推荐系统的产品形态也好,本质上都逃离不了商业变现。

一切一切“罪恶”的根源在于平台想搞钱,谁都不是搞慈善的,所以可以理解,只是最好将这个事情做的更加平滑一些,让人更容易接受一些。

从目前长视频的各大平台的“尿性”来说,打怪升级的路径为普通会员(没啥鸟用),VIP会员(以前很有鸟用,现在很多时候也没啥鸟用),VVIP会员(传说中的荣耀级,可以各种抢先看),甚至还有付费片源(这个更吊,看一个收费一个)。

其实推荐系统在这种升级打怪逻辑中是有帮助的,从普通到VIP,到VVIP,再到说服别人为单个片付费,这个难度是依次递增的。而笔者一直停留在第二级,始终上不去。

这种内容追求的递增性,需要在产品逻辑的设计上,铺垫好节奏,前戏要做足,上来就让人各种付费,凭啥?

所以,依赖推荐逻辑,将这种付费的诱导性融入到推荐的内容层级上,先逐步的挖掘用户的兴趣,先用免费资源不断的探测用户的兴趣边界,然后通过推荐不断的深化这种偏好,并且往逐步付费的道路上引导。

通俗点说就是,先用免费的把你养熟了,加大依赖性了,逐步的把兴趣点上较新更好的付费资源逐步逐层去推进,用户就不知不觉去为更好的内容付费了。

上来就让你整个VVIP,谁乐意呀(现在我都不乐意为VVIP付费,简直太侮辱人了,鬼知道过两天会不会搞出个VVVIP,不惯着),是吧。

不知不觉聊了5000字,内容有点散,不是体系化的内容,只是体验别人家产品的时候结合自身的一些专业性的一些零散思考而已。

从笔者个人的从业经验来说,推荐领域本身就是一个强业务的场景,其实单纯从模型网络角度上说,其实目前已经被挖的很多很多了,各种变形的模型,各种骚操作,都有迹可循,不会独创,总能抄上一抄。

需要自己多思考的是自身业务场景的特殊性,比如上面说的一账号多个实际主体的问题,时间维度的问题,特性互斥的问题,如何潜入商业化内容夹带私货的问题,这些才是业务场景的独有特性。

围绕观测到的独有特性,去做特殊的处理和优化。

总而言之,言而总之,对于生活,多观测多思考,形成自己的决策思路,和产品价值观,哪怕不是自己操刀做一个东西,想想也是极有意思的。

文章都看完了,还不点个赞来个赏~


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值