对比两种读取数据的方法——PyTorch

1.使用中间变量的方法

data_path = 'Cedar.csv'
data_df = pd.read_csv(data_path)
data = data_df.to_numpy()
  • 这种方法首先将数据集的路径‘Cedar.csv' 存储在变量 data_path 中。
  • 然后,使用 Pandas 的 read_csv 函数根据data_path 中的路径找到‘Cedar.csv' ,并从中读取数据并将其存储在 DataFrame data_df 中。
  • 最后,通过 to_numpy() 方法将 DataFrame 转换为 NumPy 数组 data。
  • 当使用 pandas 读取 CSV 文件时,默认情况下会得到一个 DataFrame 对象。虽然DataFrame 对象也可以直接用于一些数据处理,但在许多机器学习任务中,处理 numpy 数组更加直接和高效。除此之外,将数据转换为 numpy 数组后,能够更方便地与 PyTorch 的 Dataset 类和 DataLoader 类兼容

2.直接方法

data = pd.read_csv('Cedar.csv').values
  • 这种方法将一行代码合并为读取 CSV 文件并直接转换为 NumPy 数组。
  • pd.read_csv('Cedar.csv') 返回一个 DataFrame 对象,然后通过 .values 属性获取其对应的 NumPy 数组。

3.直接方法

  • 可读性和维护性: 使用中间变量的方法(第一种)更具可读性,尤其是在处理复杂代码或需要在读取数据后进行其他操作时。它使得你可以在读取数据后检查或修改 data_df,然后再将其转换为 NumPy 数组。

  • 简洁性: 直接方法(第二种)更为简洁,特别是在一行代码中完成读取和转换操作,适合简单场景或者在你只需要读取数据并快速进行处理时。

  • 6
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值