跟着李沐学深度学习 2.2数据预处理

最新推荐文章于 2024-03-03 22:25:21 发布

QQsh7

最新推荐文章于 2024-03-03 22:25:21 发布

阅读量1.1k

点赞数

文章标签： python 深度学习人工智能

本文链接：https://blog.csdn.net/QQsh7/article/details/121405338

版权

上一节学习的是关于张量的处理，这一节学习开始学习处理数据

1、import首先跟着教学视频操作，本节拦路虎

import os
import os 就是 导入标准库os（operating system），csv是逗号分隔值文件，用来存储数据的

2、os.makedirs(os.path.join('..', 'data'), exist_ok=True)        
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')
这两行的..困扰我很久，结果就是举例子，让自己填名称，不能填..,这里的名称就是你想创建数据的文件地址，比如我放在了E盘的learnpython下，我在这里写的就是

os.makedirs(os.path.join('E:/learnpython', 'data'), exist_ok=True)
data_file = os.path.join('E:/learnpython', 'data','house_tiny.csv')

就正确了，并且可以发现这个文件夹下多了一个data的文件夹和名为house_tiny的文件

但是后来试过只填..也可以以下是我找的大佬的讲解

os.makedirs() 方法用于递归创建目录
makedirs()方法语法格式如下：
os.makedirs(path, mode=0o777)
参数
path – 需要递归创建的目录，可以是相对或者绝对路径。
mode – 权限模式。
os.path.join()函数用于路径拼接文件路径
路径表示
. 表示当前目录
.. 表示当前目录的上一级目录。
./表示当前目录下的某个文件或文件夹，视后面跟着的名字而定
../表示当前目录上一级目录的文件或文件夹，视后面跟着的名字而定
————————————————
版权声明：本文为CSDN博主「程序员龙一」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_43658159/article/details/116646515

3、exist_ok：是否在目录存在时触发异常。如果exist_ok为False（默认值），则在目标目录已存在的情况下触发FileExistsError异常；如果exist_ok为True，则在目标目录已存在的情况下不会触发FileExistsError异常。

with open(r'filename.txt') as f:
data_user=pd.read_csv(f) #文件的读操作
with open('data.txt', 'w') as f:
f.write('hello world') #文件的写操作

4、import pandas as pd 调用pandas并且把pandas简化为pd

data = pd.read_csv(data_file) 读取csv文件并输出
print(data)

5、iloc（index location）表示的是一个文件的索引，表示对所有行，第一列到第二列赋值给inputs，对所有行，第三列赋值给outputs

fillna是表示对缺失值进行填充，而mean函数的意为求均值（3），所以这行代码的意思为用inputs的均值，对inputs的缺失值进行填充

6、get_dummies函数是对所要操作的表格进行自动转换为两列,之前不为nan的类型显示0，反之则是1，（true=1）【one hot】

7、inputs.values表示值

8、小白发问:为什么要在转换的张量后显示数据类型？

import torch

X, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
X, y

(tensor([[3., 1., 0.],
         [2., 0., 1.],
         [4., 0., 1.],
         [3., 0., 1.]], dtype=torch.float64),
 tensor([127500, 106000, 178100, 140000]))

QQsh7

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
跟着李沐学深度学习 2.2数据预处理

上一节学习的是关于张量的处理，这一节学习开始学习处理数据1、import首先跟着教学视频操作，本节拦路虎import osimport os 就是导入标准库os（operating system），csv是逗号分隔值文件，用来存储数据的2、os.makedirs(os.path.join('..', 'data'), exist_ok=True) data_file = os.path.join('..', 'data', 'house_tiny.csv')with op
复制链接

扫一扫