【云音乐】从手游APP到云音乐视频标签分类，时隔3个月再次面对多标签任务，终于摸索出了一些小经验。附自定义评估函数代码

本文链接：https://blog.csdn.net/weixin_45839693/article/details/110861882

本文分享了作者在处理多标签分类任务上的经验，从手游APP到云音乐视频标签分类。文章强调了评估函数的重要性，指出平均准确率能更好地衡量模型性能，尤其是在标签不平衡的情况下。此外，讨论了特征处理和模型构建，建议将离散特征转为类别特征并使用分域学习。最后，提出了通过IDF值解决热门标签对冷门标签压制的问题，提高了标签的多样性和区分度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【云音乐】从手游APP到云音乐视频标签分类，时隔3个月再次面对多标签任务，终于摸索出了一些小经验。

前言
一个好用的评估函数
- 常用的多标签任务评估函数
- 我选择平均准确率
合理的特征处理和模型
- 特征处理
- 合理的模型
如何面对热门标签对冷门标签的压制
总结

前言

之前在个推实习的时候，接到了对手游app的多标签分类任务，当初应该是10+个一级标签，20+个二级标签，两者之间是层次关系，当初还是懵懵懂懂只知道把所有爬下来的特征（文本、icon、包大小等）提取特征之后一股脑的拼接在一起然后随便叠几个dense层就sigmoid输出了。效果也一直不理想，对于结果的观察除了用tf自带的acc评估函数，就是人工加规则，做的非常苦恼。

最近在网易云实习，由于运维给mlog的打标并不标准，为了给mlog和user进行打散，所以需要做一个mlog多标签分类模型，对80w个mlog进行预测，共有666个标签。虽有都有现成的特征，但这次吸取了上次的经验，整个流程下来明显顺畅了很多，因此在这里想把自己的经验分享给大家。（代码和数据恕不能公开）