提出问题:
传统的分类方法,二元交叉商损失函数有何问题?不愧是大神,很有道理,简单样本太多,那么损失函数的迭代会比较慢,无法更好的优化。但是我们想关注一下难样本呢?
如何更好的学习难样本
将上面的进行改进到下面的,我们会发现容易样本的损失,比如当y=1 预测值也是1的时候,那么损失函数为0,也就是简单的正样本,如果很多那么有没有是一样的。同理简单的负样本,也就是接近0的时候那么就是0了,有没有是一样的,只有当y接近中间的时候,也就是困难样本,那么输入就是损失函数的数值。
但是在这里,比如比如下面的目标检测的问题中,负样本更加容易被检测到,也就是难的负样本的比例不高,通过上面一弄,导致我们的负样本少了。会出现再一次失衡,为了更好的平衡我们引入另一个变量,再一次调节样本的比例。