歌曲推荐场景下如何做好内容分发

最新推荐文章于 2022-06-16 09:53:47 发布

舟

最新推荐文章于 2022-06-16 09:53:47 发布

阅读量362

点赞数

分类专栏：推荐系统模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cqlboat/article/details/103950920

版权

推荐系统模型专栏收录该内容

6 篇文章 1 订阅

订阅专栏

场景

分发推歌歌曲
分发vip歌曲
分发长尾歌曲

架构

歌曲池，歌曲倒排索引，召回，排序，探索，实时监控

召回

协同过滤（itembased）

数据：用户最近180天完整播放且收藏的歌曲 uid: sid1, sid2, sid3
mapreduce 计算歌曲共现数和各个歌曲的总次数
相似度函数： jaccard 相似
输出：歌曲到相似歌曲的映射表
sid1 \t sid2,sid3,sid4

用户画像

首先计算用户画像
输入

歌曲类目：风格，语种，城市等级，省份，评论数，发布年代，艺人性别。
用户偏好歌曲（收藏或完整播放）
输出：计算用户在不通歌曲类目下的转化情况（不通类目的权重用各类目的方差归一化后）

根据用户画像推荐歌曲
输入：
用户画像
歌曲类目
输出：用户偏好分

基于向量召回

向量获取：word2vec， gcn等

i2i召回：

keys：歌曲，query：用户偏好歌曲（最近收藏或完整播放歌曲）
利用faiss向量引擎进行检索

u2i召回

youtube DNN召回：用户最近播放序列 --> 用户embedding --> softmax 进行分类（几十万label）
DSSM召回：用户embdding塔，歌曲embdding塔 --> cosine loss

如何提高歌曲向量覆盖

CB2CF

歌曲内容特征 --> cf vector cosine loss

音频

歌曲音频特征 --> cf vector cosine loss

排序

LR模型

人工交叉特征

FM模型

二阶自动交叉特征

DIN模型

用户序列attention建模，

LINUCB模型

长尾歌曲探索
偏好因子 + 探索因子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
歌曲推荐场景下如何做好内容分发

场景分发推歌歌曲分发vip歌曲分发长尾歌曲架构歌曲池，歌曲倒排索引，召回，排序，探索，实时监控召回协同过滤（itembased）数据：用户最近180天完整播放且收藏的歌曲 uid: sid1, sid2, sid3mapreduce 计算歌曲共现数和各个歌曲的总次数相似度函数： jaccard 相似输出：歌曲到相似歌曲的映射表sid1 \t sid2,sid3,sid...
复制链接

扫一扫

专栏目录

舟 CSDN认证博客专家 CSDN认证企业博客

码龄13年

40: 原创

7万+: 周排名

80万+: 总排名

27万+: 访问

: 等级

3191: 积分

99: 粉丝

88: 获赞

35: 评论

205: 收藏

私信

关注

热门文章

分类专栏

最新评论

Rsync源码——校验块匹配（math.c）
正版芦花: 请问s2为什么必须是奇数啊
DeepFM模型介绍
数道难: 代码这里： concat_input = tf.concat([self.y_first_order, self.y_second_order], axis=1),感觉根据公式应该是y_first_order跟y_second_order相加而不是拼接吧？
ReadProcessMemory/C++的探索
混元太极马保国: 用EnumProcessModulesEx可以获得模块的基址
推荐系统中的用户冷启动问题
虚坏叔叔: 涨粉多大多都是一些标题党。鄙视他们，搞整个csdn技术氛围很差，现在翻看一些好的文章大多都是很久以前发表的了。
推荐系统中的用户冷启动问题
u012804784: 在朋友圈看到，特地来赞一个！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。