李沐动手学深度学习 python0基础 05数据预处理

import pandas as pd
import os
import torch

os.makedirs(os.path.join('..','data1'),exist_ok=True)
//用来创建多层目录,exist_ok=True意思是如果已经存在这层目录也不会有影响,若=False则会报错
data1_file = os.path.join('..','data1','Animal Acrossing.csv')
//创建data1_file 路径,文件名与类型如后所示

with open(data1_file,'w') as f:
    //with open..as f可以有效减少重复打开文件造成资源浪费
    f.write('island,animal,money,sex\n')
    f.write('NA,pig,10,girls\n')
    f.write('north,cat,9,boys\n')
    f.write('south,NA,NA,NA\n')
    f.write('north,dog,2,girls\n')
    
data = pd.read_csv(data1_file)
print (data)

inputs,outputs = data.iloc[:,2],data.iloc[:,3]
//将数据列表中第2列和第3列分别命名成inputs和outputs
inputs = inputs.fillna(inputs.mean())
//将intputs中间的所有空值NA填充上其他项目的平均值
print(inputs)

outputs = pd.get_dummies(outputs,dummy_na=True)
//将outputs的元素进行one-shot编码,dummy_na意思是数据中如果中空值的话,
代码要求返回True则会新增一列来表示NaN的情况,若返回False则不存在这样一列
print(outputs)

x,y = torch.tensor(inputs.values),torch.tensor(outputs.values)
print(x,y)

0基础开始跟的话看起来还是有点吃力的
整个04看了很久才差不多搞懂里面的意思

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值