本篇文章主要介绍三种损失函数,pointwise、pairwise、listwise。
1. 单点法(Pointwise)
释义
Pointwise 仅考虑单个query和document的关系,会把将问题转化为多分类或回归问题,对于分类问题,正负例可以通过用户的点击来构造。
示例
对于如下数据,我们可以使用二分类训练模型,数据之间没有影响关系。
缺点
- Pointwise 完全从单文档的分类角度计算,没有考虑文档之间的相对顺序。所有正样本之间的相关性,是不会考虑(比如用户搜索「刘亦菲」,「刘亦菲百度百科」要好于「刘亦菲已出道10年」,但是point wise却无法分别),同样所有的负样本之间的相关性也是不会考虑的。然而排序追求的是排序结果,并不要求精确打分。
- 损失函数中没有引入url排序的位置信息,因此,损失函数可能会过多强调那些不重要的结果,即那些排序在后面对用户体验影响小的结果。