腾讯音乐评论审核、分类与排序算法技术

导读: 本次分享的题目为音乐评论AI审核与排序,主要围绕以下三个方面展开:

  • 背景介绍
  • 评论审核
  • 评论排序

01 背景介绍

1. 业务场景对比

音乐评论是音乐类APP里面比较重要的模块之一,它是用户表达心情和观点的窗口。我们主要有两个相关的业务场景,第一个是QQ音乐,第二个是全民K歌。这两个业务场景的评论是有差异的。QQ音乐中的评论类型很丰富,包括个人崇拜类、玩梗类、个人听歌感受类等。通常这些评论长难句子相对较多,语法较难。而K歌中的评论主要以互动和评价为主,句子较短,语法相对简单。此外,QQ音乐每日的新增评论大约有几十万条,而全民K歌则有千万量级之多。

2. 评论审核

评论审核指根据评论的质量去操作评论的状态。比如,对于一些抄袭、辱骂、或是包含敏感词的评论,我们会对它们进行隐藏,删除或者设为仅自己可见等等;对于一些轻度负面或者盖楼型的评论,我们可能会给它贴上劣质的标签,在排序上进行降权,减少曝光。此外,对于一些潜在的优质评论,是指那些文字写得不错,并且跟歌曲内容比较相关,但是因为点赞数较低而处于一个比较靠后的排序位置的评论,我们会在短期内给它们一个头部位置,使它们得到足够多的曝光。

我们针对不同的业务场景训练模型,让模型给出操作建议来辅助审核,甚至自动审核,以达到减少人力成本的目的。

3. 评论排序

好的排序可以极大提升用户阅读评论的体验。我们的算法需要综合考虑更多的因素,给出更优的分发方式。我们主要考虑了两类因子:

第一个是文本语义标签,包括文本的质量、主题、情绪等等。第二个是后验因子,包括评论的点赞、回复以及点赞飙升情况等。

上图是我们的一个排序白板,带颜色的部分是评论的文本标签,后面是它的置信度。而图右的一些数值就是后验因子。

我们将相关技术应用到QQ音乐的评论排序上面,在最热和最新tab的基础上增加了一个推荐序tab,使得排序核心指标得到了有效的提升。

02 评论审核-QQ音乐

1. 业务目标

审核的人力无法满足需求,因此我们 需要借助NLP实现两个业务目标 :①使用模型辅助审核,提高审核效率。②实现部分评论的自动审核。

上图右侧红框内是文本质量标签和模型给出的处理意见,其下面打码的部分是一些具体操作。

2. 质量模型

基于上述业务目标,我们 构建了一个质量模型 。 我们把文本质量分为优质、良好、普通、劣质四类标签,主要以语言的优美流畅性,与歌曲的相关性,情感极性以及主题类别等作为考量因素。 例如上图中的红色评论,首先它和歌曲名有一定的相关性,并且使用了对偶句式。它的语言是比较优美流畅的,因此,我们给它打上了优质的标签。相较之下,黄色的评论是批评周董唱功,我们就给它打上了劣质的标签。插播一条广告:需要开通正版JetBrains全家桶的可以联系我,56元一年,正版授权,官网可查有效期,有需要的加我微信:poxiaozhiai6,备注:910。

结合质量标签以及评论状态,模型可以给出具体的操作建议,从而辅助

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值