图像分割处理不均衡数据集

最新推荐文章于 2024-03-29 20:52:01 发布

带佩亚诺余项的麦克劳林

最新推荐文章于 2024-03-29 20:52:01 发布

阅读量749

点赞数 1

文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GJXcsdn/article/details/124706842

版权

1.过采样和欠采样

在这里插入图片描述

上图中，蓝色的类别比橘黄色的类别的样本多得多。这种情况下，我们在预处理时，有两种选择。
欠采样 意思是从多数的类别中只采样其中的一部分的样本，选择和少数类别同样多的样本。这种采样保持了该类别原来的数据分布。这很容易，我们只需要少用点样本就可以让数据变得均衡。
过采样 的意思是我们复制少数类别中的样本，使得数量和多数样本一样多。复制操作需要保持少数样本的原有的数据分布。我们不需要获取更多的数据就可以让数据集变得均衡。采样的方法是一个很好的类别均衡的方法。
注：一定要保持采样后的数据分布和原有数据分布类似。

data argumentation：

基本数据增强主要包含如下方式：
1.旋转：可通过在原图上先放大图像，然后剪切图像得到。
2.平移：先放大图像，然后水平或垂直偏移位置剪切
3.缩放：缩放图像
4.随机遮挡：对图像进行小区域遮挡
5.水平翻转：以过图像中心的竖直轴为对称轴，将左、右两边像素交换
6.颜色色差（饱和度、亮度、对比度、锐度等）
7.噪声扰动: 对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;

2.权值均衡（损失敏感函数）

权值均衡是在训练样本的时候，在计算loss的时候，通过权值来均衡数据的分布。正常情况下，每个类别在损失函数中的权值是1.0。但是有时候，当

最低0.47元/天解锁文章

带佩亚诺余项的麦克劳林

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
图像分割处理不均衡数据集

1.过采样和欠采样上图中，蓝色的类别比橘黄色的类别的样本多得多。这种情况下，我们在预处理时，有两种选择。欠采样意思是从多数的类别中只采样其中的一部分的样本，选择和少数类别同样多的样本。这种采样保持了该类别原来的数据分布。这很容易，我们只需要少用点样本就可以让数据变得均衡。过采样的意思是我们复制少数类别中的样本，使得数量和多数样本一样多。复制操作需要保持少数样本的原有的数据分布。我们不需要获取更多的数据就可以让数据集变得均衡。采样的方法是一个很好的类别均衡的方法。注：一定要保持采样后的数据分布和..
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。