神经网络训练数据准备---数据标签在numpy和tensor之间的转换及处理---Pytorch实现

最新推荐文章于 2024-07-28 11:56:04 发布

心之所向521

最新推荐文章于 2024-07-28 11:56:04 发布

阅读量3.4k

点赞数 2

分类专栏：神经网络数据准备 python学习文章标签：神经网络 pytorch 深度学习 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45564943/article/details/122353197

版权

python学习同时被 2 个专栏收录

45 篇文章 7 订阅

订阅专栏

神经网络数据准备

16 篇文章 3 订阅

订阅专栏

目录

1.从txt文档中读取训练数据和测试数据

2.从txt文件中读取标签数据

3.将训练数据和测试数据转化为tensor形式，为后面训练做准备，因为训练数据在pytorch要求一般为tensor格式

4.将标签转化为float型(此处是因为做的是回归任务)，如果想要做分类任务的话需要将标签转化为long型！

5.将已经转化为tensor格式的(train_datas, train_labels)和(test_datas, test_labels)转化为Data.DataLoader可以使用的格式

6.利用Data.DataLoader来对数据集进行迭代

1.从txt文档中读取训练数据和测试数据

fp = open('E:\\桌面\\test_new_3\\data\\train.txt', 'r', encoding='utf-8')
string = fp.read()  # string是一行字符串，该字符串包含文件所有内容
fp.close()
row_list = string.splitlines()  # splitlines默认参数是‘\n’
data_list = [[float(i) for i in row.strip().split(" ")] for row in row_list]
shuffle(data_list) ##打乱数据
data_train = np.array(data_list)     # data=data.to_numpy()
fp = open('E:\\桌面\\test_new_3\\data\\test.txt', 'r', encoding='utf-8')
string = fp.read()  # string是一行字符串，该字符串包含文件所有内容
fp.close()
row_list = string.splitlines()  # splitlines默认参数是‘\n’
data_list = [[float(i) for i in row.strip().split(" ")] for row in row_list]
shuffle(data_list) ##打乱数据
data_test = np.array(data_list)     # data=data.to_numpy()

2.从txt文件中读取标签数据

fp = open('E:\\桌面\\test_new_3\\label\\1004.txt', 'r', encoding='utf-8')
line = fp.readline()
l = line.split(",")
label1 = [[float(i)] for i in l]
label1 = np.array(label1)
fp = open('E:\\桌面\\test_new_3\\label\\355.txt', 'r', encoding='utf-8')
line = fp.readline()
l = line.split(",")
label2 = [[float(i)] for i in l]
label2 = np.array(label2)
# label1 = np.loadtxt('./284.txt', dtype=np.float32, delimiter=' ')
# print("原始红外矩阵大小为：", label1)
# label2 = np.loadtxt('./71.txt', dtype=np.float32, delimiter=' ')
# print("原始红外矩阵大小为：", label2)
train_datas = data_train
train_labels = label1
test_datas = data_test
test_labels = label2

3.将训练数据和测试数据转化为tensor形式，为后面训练做准备，因为训练数据在pytorch要求一般为tensor格式

##这几步的作用就是将数据转化为tensor的格式，为后面训练做准备（因为训练的时候数据要是tensor格式）
##同时，train_datas = train_datas / 1.0 ，这里的作用就是将其强制转化为浮点类型
train_datas = train_datas / 1.0
train_datas = torch.from_numpy(train_datas).float()
test_datas = test_datas / 1.0
test_datas = torch.from_numpy(test_datas).float()

4.将标签转化为float型(此处是因为做的是回归任务)，如果想要做分类任务的话需要将标签转化为long型！

train_labels = torch.from_numpy(train_labels).float()
test_labels = torch.from_numpy(test_labels).float()

5.将已经转化为tensor格式的(train_datas, train_labels)和(test_datas, test_labels)转化为Data.DataLoader可以使用的格式

torch_dataset_train = Data.TensorDataset(train_datas, train_labels)
torch_dataset_test = Data.TensorDataset(test_datas, test_labels)
print(train_datas.size())                 # (60000, 28, 28)
print(train_labels.size())
print(test_datas.size())
print(test_labels.size())

6.利用Data.DataLoader来对数据集进行迭代

train_loader = Data.DataLoader(dataset=torch_dataset_train, batch_size=BATCH_SIZE, shuffle=True)

7.训练流程

a = []
for epoch in range(EPOCH):
    for step, (b_x, b_y) in enumerate(train_loader):   # train_loader的用法！
        # print(b_x.size())
        b_x = b_x.view(-1, 3)
        # print(b_x.size())
        output = mlp(b_x)            # logistic output
        loss = loss_func(output, b_y)   # cross entropy loss
        optimizer.zero_grad()           # clear gradients for this training step
        loss.backward()                 # backpropagation, compute gradients
        optimizer.step()                # apply gradients

        if step % 50 == 0:
            test_output = mlp(test_x.view(-1, 3))
            accuracy = (((abs(test_output.detach().numpy()-test_y.numpy()) < 0.1)).sum())/len(test_y.numpy())
            print('Epoch: ', round(epoch), '| train loss: %.4f' % loss.data.numpy(), '| test accuracy:%.2f' % accuracy)
            a.append(accuracy)

End···

心之所向521

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
4
评论
神经网络训练数据准备---数据标签在numpy和tensor之间的转换及处理---Pytorch实现

目录1.从txt文档中读取训练数据和测试数据2.从txt文件中读取标签数据3.将训练数据和测试数据转化为tensor形式，为后面训练做准备，因为训练数据在pytorch要求一般为tensor格式4.将标签转化为float型(此处是因为做的是回归任务)，如果想要做分类任务的话需要将标签转化为long型！5.将已经转化为tensor格式的(train_datas, train_labels)和(test_datas, test_labels)转化为Data.DataLoader可以使用的格式
复制链接

扫一扫

专栏目录

心之所向521 CSDN认证博客专家 CSDN认证企业博客

码龄5年

115: 原创

7029: 周排名

3万+: 总排名

56万+: 访问

: 等级

2151: 积分

5577: 粉丝

683: 获赞

221: 评论

2551: 收藏

私信

关注

热门文章

分类专栏

最新评论

大批量图片重命名---python解决（保证原来的顺序）
一只BIG白: import cv2 import os import sys # 需要读取的路径 input_dir = 'C:/Users/32837/Desktop/images' output_dir = 'C:/Users/32837/Desktop/image_later' if not os.path.exists(output_dir): os.makedirs(output_dir) index = 1 file = os.listdir(path=input_dir) # file.remove('.DS_Store') file.sort(key=lambda x:int(x.split('.')[0])) for item in file: img = cv2.imread(os.path.join(input_dir, item),cv2.IMREAD_COLOR) print('Being processed picture %s' % index+" "+item) # 灰度转换 gray = img # cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 局部直方图均衡化处理 # clahe = cv2.createCLAHE(clipLimit=2, tileGridSize=(10, 10)) ## 限制对比度自适应直方图均衡化 # 将灰度图像和局部直方图相关联, 把直方图均衡化应用到灰度图 # result = clahe.apply(gray) # 保存图片 cv2.imwrite(output_dir + '/' + str(index) + '.jpg', gray) index += 1 key = cv2.waitKey(30) & 0xff if key == 27: sys.exit(0) 或者用这个
linux下对摄像头曝光度的命令调节
Matter wave: 请问曝光设置为100，是100毫秒还是微妙呢
MediaPipe实现手指关键点检测及追踪，人脸识别及追踪
心之所向521: 不卡，我感觉速度挺快的
MediaPipe实现手指关键点检测及追踪，人脸识别及追踪
Sivan779: 请问大佬，这个会很卡吗，或者说延迟很高吗
利用PaddleDetection部署自己的轻量级移动检测嵌入式平台（多种高性能网络模型）--Pytorch实现
akhdkbsafiojf: 你好，请问训练好的模型是怎么部署到嵌入式设备的呢？

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

心之所向521 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。