相当于是在小于1的部分使用2范数(更smooth,且求导方便),在大于1的部分使用1范数(避免梯度爆炸,同时减少outlier的影响)
smooth_L1个人理解
最新推荐文章于 2024-07-14 18:04:05 发布
相当于是在小于1的部分使用2范数(更smooth,且求导方便),在大于1的部分使用1范数(避免梯度爆炸,同时减少outlier的影响)