https://blog.csdn.net/huagong_adu/article/details/40710305
sigmoid 函数是那个字母 yibuxilong吗?
s是两种,也就是s的形状;一个是logistic =yibuxilong, 还有tanh(x)
2) 损失函数是一个类线性函数,可以有效减少异常样本数据对模型的影响,因此具有鲁棒性
这是啥意思?
这里是啥意思?是说tree代替神经网络进行loss预测,还是tree就是上面的lrt方法?
https://blog.csdn.net/hguisu/article/details/7989489
评价两个评分函数的KL距离?
https://www.cnblogs.com/bentuwuying/p/6690836.html
对于一个排序,RankNet从各个doc的相对关系来评价排序结果的好坏,排序的效果越好,那么有错误相对关系的pair就越少。所谓错误的相对关系即如果根据模型输出Ui排在Uj前面,但真实label为Ui的相关性小于Uj,那么就记一个错误pair,RankNet本质上就是以错误的pair最少为优化目标。而在抽象成cost function时,RankNet实际上是引入了概率的思想:不是直接判断Ui排在Uj前面,而是说Ui以一定的概率P排在Uj前面,即是以预测概率与真实概率的差距最小作为优化目标。最后,RankNet使用Cross Entropy作为cost function,来衡量对的拟合程度:
为什么Cross Entropy 可以作为cost function?