【PyTorch】数据增强之Label shuffling实现（神经网络训练时样本不平衡解决方法）

最新推荐文章于 2022-08-30 12:01:16 发布

ncc1995

最新推荐文章于 2022-08-30 12:01:16 发布

阅读量899

点赞数

分类专栏： pytorch 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ncc1995/article/details/91467392

版权

本文介绍了在使用PyTorch训练神经网络时，如何通过Label Shuffling来解决样本不平衡问题。作者首先使用ImageFolder读取数据，接着对数据集进行划分，得到图像路径列表和标签列表。在进行数据增强时，注意到直接打乱两个列表会导致排序不一致，因此采用字典来保持数据与标签的对应。但由于字典打乱后会破坏原有的样本，作者改为使用元组的方式来正确地实现数据增强。

摘要由CSDN通过智能技术生成

前面的数据是采用PyTorch的ImageFolder读取的，读取后的数据进行了训练集数据集的划分，分别得到了image路径列表和label标签列表，再传入自己写的label_shuffling进行数据增强，返回后通过PyTorch的DataLoader加载到网络里。

def label_shuffling(data, labels):
    #得到样本数最多的类别的样本数
    maxNum_sample = Counter(labels).most_common(1)
    #得到所有label，分别对每个label进行扩增
    no_repeat_labels = len(set(labels))
    data_list = []
    label_list = []
    #先对label 0 扩增，再对label 1，再对label 2
    for i in range(no_repeat_labels):
        current_data = []
        current_label = []
        for j in range(len(labels)):
            if i == labels[j]:
                current_label.append(labels[j])
                current_data.append(data[j])
        #根据最多的样本数，对每类都产生一个随机排列的列表
        one_class_list = list(range(maxNum_sample[0][1]))
        random.shuffle(one

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ncc1995 CSDN认证博客专家 CSDN认证企业博客

码龄6年

95: 原创

7万+: 周排名

148万+: 总排名

50万+: 访问

: 等级

4281: 积分

50: 粉丝

228: 获赞

104: 评论

646: 收藏

私信

关注

热门文章

分类专栏

yolo 2篇
pytorch 16篇
计算机基本操作 10篇
Leetcode 1篇
Kaggle 1篇
Cpp 2篇
C语言 1篇
机器学习 1篇
python基础 18篇
JAVA基础 15篇
数据结构 12篇
TensorFlow 10篇
剑指offer 5篇
深度学习 13篇
ssm 3篇
idea 7篇
oracle 1篇
springboot 3篇
MySQL 1篇
Linux 3篇
软件安装及使用 3篇

最新评论

【深度学习】运行grad-cam（pytorch代码）遇到的一些问题
_我的旺仔呢_: 哥，有解决回归问题的方法了吗
【PyTorch】RuntimeError: one of the variables needed for gradient computation has been modified by an
m0_57041719: 感谢博主，x+=... 改为 x=x+... 就好了
【pyTorch】nn.Conv2d中的padding计算
琪琪花: 请问在哪里可以看到向下取整？
【PyTorch】使用pytorch提供的模型训练inception V3（使用预训练模型）
m0_59781092: 我总是出现AttributeError: 'Tensor' object has no attribute 'logits'问题，修改了又会报错"TypeError: expected Tensor as element 0 in argument 0, but got InceptionOutputs"这是为什么呀？请问有解决的方法嘛？
【Python】找到最大连通区域，并画出bounding box
weixin_44111383: [code=python] import numpy as np import cv2 from skimage import measure from matplotlib import pyplot as plt from matplotlib.patches import Rectangle from PIL import Image import copy path = '' if 'mask' in path: img = np.asarray(Image.open(path)) else: img = cv2.cvtColor(np.asarray(Image.open(path)),cv2.COLOR_BGR2GRAY) max_v = np.max(img) ret,ee = cv2.threshold(img,0.3*max_v,max_v,cv2.THRESH_BINARY) labeled_img,mcr = largestConnectComponent(ee) fig, ax = plt.subplots(ncols=1, nrows=1, figsize=(6, 6)) ax.imshow(mcr) for region in measure.regionprops(labeled_img): # skip small images if region.area < 50: continue # print(regionprops(labeled_img)[max_label]) minr, minc, maxr, maxc = region.bbox rect = Rectangle((minc, minr), maxc - minc, maxr - minr, fill=False, edgecolor='red', linewidth=2) ax.add_patch(rect) plt.show() [/code]

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。