pytorch--数据预处理

最新推荐文章于 2024-05-03 10:56:59 发布

XoneyCream

最新推荐文章于 2024-05-03 10:56:59 发布

阅读量112

点赞数

分类专栏： pytorch 深度学习

本文链接：https://blog.csdn.net/weixin_32304201/article/details/118302380

版权

深度学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

pytorch

11 篇文章 0 订阅

订阅专栏

数据预处理

创建一个人工数据集，并存储在csv文件中

import os
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file = os.path.join('..','data','house_tiny.csv')
with open(data_file,'w') as f:
    f.write('NumRooms,Alley,Price\n')
    f.write('NA,Pave,127500\n')
    f.write('2,NA,10600\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')

从创建的csv文件中加载数据集

import pandas as pd 
data = pd.read_csv(data_file)
print(data)

在这里插入图片描述
缺失值处理：插值和删除

inputs,outputs = data.iloc[:,0:2],data.iloc[:,2]
#将值为空的元素用平均值填充
inputs = inputs.fillna(inputs.mean())
inputs,outputs

在这里插入图片描述
对于inputs中的类别值或离散值，将‘NaN’视为一个类别

inputs = pd.get_dummies(inputs,dummy_na=True)
print(inputs)

在这里插入图片描述

XoneyCream

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch--数据预处理

数据预处理创建一个人工数据集，并存储在csv文件中import osos.makedirs(os.path.join('..','data'),exist_ok=True)data_file = os.path.join('..','data','house_tiny.csv')with open(data_file,'w') as f: f.write('NumRooms,Alley,Price\n') f.write('NA,Pave,127500\n') f.writ
复制链接

扫一扫