视频技术系列 - 短内容冷启动推荐方法,最小收益最大化

作者,中国移动李琳,咪咕灯塔

在众多内容平台中存在严重的马太效应,现象表明,热门内容逐渐走向流行,例如大量歌曲长时间得不到曝光,使得平台数据开始服从长尾分布,即20%的热门内容聚集了74%的收听行为。对千万数量级的音乐曲库来说,用户行为的数据稀疏性比其他内容(如书籍、电影)平台更为严重,此外,每天新上架的作品会进一步加剧数据的稀疏性。为了缓解数据稀疏导致的不精准推荐问题,当前主流方法是将用户和歌曲分别映射到相同的稠密语义空间,然后利用用户和歌曲在该空间中的内积来挖掘用户对歌曲的偏好关系。虽然这种方法在一定程度上提升了歌曲推荐的准确率,但仅能挖掘用户与歌曲的一般性关系,无法从全局和细粒度层面区分用户对歌曲局部特征的偏好程度。加之,大量新上架歌曲和非热门歌曲导致模型在不同数据稀疏度下的鲁棒性下降。

对于短视频内容的,冷启动用户观看的内容,如何尽可能覆盖到用户的偏好,从而发现用户兴趣,进行用户推荐的实时性和精准性,一直是个研发课题。对于冷启动用户常推荐热门视频或将视频内容先根据特征做分类聚类,使用GBDT+LR算法或深度学习算法wide&deep对视频内容质量评分,预测新上架视频内容的点击率,然后将尽可能宽范围的视频按评分推荐给用户,以尽可能覆盖到用户的偏好,从而发现用户兴趣,进行用户画像,完成冷启动。

一、冷启动问题中的难点

推荐系统的冷启动一直是工业应用中的难点,成为热门的视频一定是很多用户已经点击观看过,不再是很新的内容,新内容在得到用户的直接行为反馈前,预测的内容评分值并不能真正衡量内容的质量

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
推荐系统冷启动,是指在推荐系统运行初期或者新添加了一类物品时,由于缺乏足够的用户行为数据,导致难以对这些物品进行个性化推荐的问题。通常情况下,推荐系统推荐准确度与数据量成正比,缺乏行为数据的物品很难被推荐系统准确地推荐给用户,这就是冷启动问题。 解决推荐系统冷启动问题的方法有很多,下面列举一些: 1. 利用物品属性信息:对于新物品,可以利用物品的属性信息来进行推荐,比如对于新电影,可以根据电影的类型、导演、演员等属性信息,结合用户的偏好,进行推荐。 2. 利用用户画像信息:通过收集用户的个人信息、兴趣爱好、历史行为等数据,建立用户画像,从而对新物品进行个性化推荐。 3. 利用专家知识:对于某些领域的专家,可以通过其对物品的评价或分类,来对新物品进行推荐。 4. 利用协同过滤算法:通过对用户和物品相似度的计算,来进行推荐,比如基于物品的协同过滤算法或基于用户的协同过滤算法。 5. 利用探索-利用策略:在推荐系统中加入一些随机性,对新物品进行探索,同时也保持对已有数据的利用,从而达到平衡推荐精度和推荐多样性的目的。 需要注意的是,不同的推荐系统冷启动问题可能存在不同的解决方法,需要根据不同的场景和数据类型选择适合的解决方法。同时,通过不断的数据收集和分析,也可以逐步解决推荐系统冷启动问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值