样本不均衡问题与损失函数

最新推荐文章于 2023-05-31 11:58:00 发布

Bingoyear

最新推荐文章于 2023-05-31 11:58:00 发布

阅读量2.1k

点赞数 1

分类专栏： Pytorch使用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/angel_hben/article/details/103369346

版权

Pytorch使用专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1、样本不均衡问题

主要分为以下几类：
1）每个类别的样本数量不均衡
2）划分样本所属类别的难易程度不同

2、Focal loss

focal loss用来解决难易样本数量不均衡，重点让模型更多关注难分样本，少关注易分样本。
假设正样本（label=1）少，负样本多，定义focal loss如下

Loss = -[alpha*(1-y_hat)^2yln(y_hat)
+ (1-alpha)y_hat^2(1-y)*ln(1-y_hat)]
其中y_hat:(batch, seq, tags)，预测出的
y: (batch, seq, tags)
alpha：(1, 1, tags)
alpha是超参数，是正样本损失占总体的比例，初始化为少数样本/总样本的比值，调整策略如下，正样本的precision<recall时，训练更关注正样本，alpha调低，反之调高。
调整策略也可以为：
正类的识别正确率与负类的识别正确率

3、GHM loss

GHM用来解决难分样本中的离群点。模型不应过多关注易分样本，也不应过多关注离群很远的难分样本（特别难分的）。

4、加权loss

用来解决样本类别数量不均衡问题，某些类别的样本特别多或特别少。

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
样本不均衡问题与损失函数

focal loss用来解决样本不均衡的分类问题。假设正样本（label=1）少，负样本多，定义focal loss如下Loss = -[alpha*(1-y_hat)^2yln(y_hat)+ (1-alpha)y_hat^2(1-y)*ln(1-y_hat)]其中y_hat:(batch, seq, tags)，预测出的y: (batch, seq, tags)alpha：(1, ...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。