现在主流的推荐链路可以划分为“召回–>粗排–>精排–>重排”四个阶段,也可以简化成“召回–>排序”两个阶段。
模型从0–>1的演进和1–>n的阶段不同,面临的问题也不同,这里主要关注1–>n的提升,分为突破瓶颈期和bad case解决两个部分。
突破瓶颈期
突破瓶颈期最核心的因素是识别什么是模型瓶颈,然后去定向优化解决。所以这里线介绍几个识别瓶颈的方法:
识别瓶颈
各个维度审视现在模型整体结构潜在的问题或者不足,明确哪些问题可以在现有模型下解决?哪些问题需要调整模型解决?
其中最有效的手段就是 case 查询。
查case
对于提升业务来说,查预测的case进行分析,将错误的case分门别类,针对没勒问题分析提出解决方案, 比单纯优化算法不断使用复杂算法来的有用的多。
解决瓶颈
针对原有模型的优化
-
看相关论文,技术方案
查看原始论文、技术博客等应用该模型的人的优化方案,尤其是工业界应用的优化方案。
对论文中模型的应用,特别是纯学术界的方案,更应该主要注重借鉴思路,给现有模型做加法,因为实际业务数据庞大,并且问题场景复杂,直接照搬带来的变化过大,效果变化时很难具体定位原因。 -
每次尝试之后总结业务特点
针对有