正样本/反(负)样本/易区分样本/难区分样本

最新推荐文章于 2024-04-07 16:21:51 发布

wanghua609

最新推荐文章于 2024-04-07 16:21:51 发布

阅读量3.8k

点赞数 6

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38145317/article/details/100514983

版权

网络训练中,常会遇到这些术语,比如

(1) 正样本和反(负)样本数不相同,甚至相差悬殊(实际上往往正样本数远远小于负样本数),如何解决样本呢不均衡问题?

(2) 在选择负样本(正样本)的过程中,很多样本都是易于区分的,也就是说,这些样本对于模型性能的提升贡献较小,添加了这些样本不仅对于模型的提升帮助有限,同时大量的这些样本也主导了梯度更新的方向,浪费了训练时间.

这些话都什么意思?各种样本什么区别?还是举个例子来看下:

现在我要训练一个模型,能认出斑点狗,也就是说,送给神经网络好多图片,如果图片中有斑点狗,那么输出1,否则输出0,显然在我们训练神经网络模型的过程中,我们会遇到这样的情况:

(1) 包含有斑点狗的样本太少(其他任何不是斑点狗的图片都可以作为负样本)

(2)很多负样本容易区分,比如什么飞机照片,人照片,火车照片,这些都不包含斑点狗,同时也是包含易区分样本,而对于哈士奇,哈巴狗等这些同样是购得样本就是较难区分的样本(因为大家都是狗啊,只是身上有没有黑斑而已...)

(3)大量无管样本主导了梯度更新的方向.

借用retinanet论文的话来说https://arxiv.org/pdf/1708.02002.pdf

在训练的过程中,由于大多数都是简单易分的负样本(属于背景的样本),使得训练过程不能充分学习到属于那些有类别样本的信息,其次简单易分的负样本太多,可能掩盖了其他类别样本的作用(这些简单易分的负样本仍产生一定幅度的loss,见下图的蓝色曲线,数量多会对loss起主要贡献作用,因此就主导了梯度的更新方向,掩盖了重要的信息)

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

wanghua609 CSDN认证博客专家 CSDN认证企业博客

码龄8年

421: 原创

2万+: 周排名

34万+: 总排名

226万+: 访问

: 等级

1万+: 积分

342: 粉丝

1640: 获赞

230: 评论

5631: 收藏

私信

关注

热门文章

最新评论

向日葵远程控制linux/window安装
joseph1314520: 还有Linux版本10.0的安装包吗
python 字典defaultdict(list)
満湫: [code=python] result = {} for (key, value) in data: if key not in result: result[key] = [] result[key].append(value) [/code] 以小弟的拙见。第一个方法感觉可以改成，先判断键在不在这个result里，如果不在，就在这个键对应位置创一个空列表，用来装那些数据。防止报错
python 字典defaultdict(list)
満湫: Traceback (most recent call last): File "D:\Work_APP\Anconda\envs\motionbert\lib\site-packages\IPython\core\interactiveshell.py", line 3457, in run_code exec(code_obj, self.user_global_ns, self.user_ns) File "<ipython-input-31-a115a0c08eff>", line 3, in <module> result[key].append(value) AttributeError: 'int' object has no attribute 'append'
python 字典defaultdict(list)
満湫: 第一个方法不太行呀
向日葵远程控制linux/window安装
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。