阅读此博文的基础上有部分存疑的地方,做了补充。原文写的很好,建议阅读。
原博:https://www.cnblogs.com/king-lps/p/9497836.html
个人理解补充部分:
1.gamma作用是调节难易,alpha作用是平衡正负样(正负样本数量不均衡)。
2.gamma作用是调节难易样本对于总loss的权重(正负样本中都有难易,都进行了调节)。gamma=2时,正样本中越是难区分的样本权重更高,越是容易区分的样本权重越低;负样本也是同样,越是难区分的样本权重更高,越是容易区分的样本权重越低;
3.alpha作用是平衡正负样本数量对于总loss的权重。一般情况,负样本会远远多于正样本数量,造成样本不平衡,alpha大于0.5的值才可以进行调节。但是因为已经有gamma=2的调节,所以文中最终取alpha=0.75是最好的。可以大概理解为,因为有gamma的调节后,alpha=0.75效果最好,是因为更需要负样本中的困难样本,对正样本的困难样本的相对需求少一些。