Python深度学习入门之pandas基础使用(读文件、索引、存文件)

本文介绍了如何使用Python的pandas库读取CSV和TXT文件,包括设置列名、索引和数据类型,以及如何通过iat和iloc进行数据访问和切片。此外,还讲解了pandas的to_csv函数用于文件保存,演示了如何配置文件格式和标签。
摘要由CSDN通过智能技术生成

Python自带的pandas是深度学习最常用的库之一,在深度学习中经常用来读取标签文本数据,作为深度学习入门,只需要掌握读文件、索引、存文件即可,其他在深度学习中不是很常用,等要用到的时候看看函数API就行。

1 读文件

读文件一般常用的是pd.read_csv()、pd.read_excel()两种,分为对应csv/txt、excel格式的文件,下面以read_csv()为例,说明其用法。

import pandas as pd
#一般csv、TXT文件为逗号或空格分隔,根据需要设置
data =  pd.read_csv("./test1.txt", sep=' ') #以空格为分隔符读取文件至pandas表格中,其他默认

常设置的形参解释如下表所示:

形参解释
header指定第几行作为列名(忽略注解行),如果没有指定列名,默认header=0; 如果指定了列名header=None
index_col默认为None 用列名作为DataFrame的行标签,如果给出序列,则使用MultiIndex。如果读取某文件,该文件每行末尾都有带分隔符,考虑使用index_col=False使panadas不用第一列作为行的名称。
dtype例子: {‘a’: np.float64, ‘b’: np.int32} 指定每一列的数据类型,a,b表示列名

例如:不把第一行作为列标签、不把第一列作为行标签、数据类型视为np.float64的读取代码如下:

# 实例
data =  pd.read_csv("./test1.txt", sep=' ', header=None, index_col=False, dtype=np.float64)

2 索引

2.1 pandas较新版本中的at()、loc()函数已被移除,不推荐使用
2.2 值索引:DataFrame.iat()

# 值索引
data =  pd.read_csv("./test1.txt", sep=' ', header=None, index_col=False, dtype=np.float64)
a = data.iat[1, 2] #将data第二行、第三列的数据值赋给a,a的类型为np.float64

2.3 切片索引:DataFrame.iloc()

# 切片索引,注意区间是左闭右开
data =  pd.read_csv("./test1.txt", sep=' ', header=None, index_col=False, dtype=np.float64)
a = data.iloc[:3, :] #将data的前三行的所有数据赋给a

3 存文件

pandas存文件函数API为:

 DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
形参解释
path_or_buf文件保存的路径
sep默认是以 ,逗号进行分割 , 也可以自己制定
columns保存索引列和指定列
index是否写进行索引 0或者1
header是否写入列索引值
na_rep=NaN将缺失值写为NaN,如果不写默认为空
float_format=’%.2f’保留两位小数

例如:以空格作为分隔符,写入行标签和列标签的代码如下:

# 实例
data =  pd.read_csv("./test1.txt", sep=' ', header=None, index_col=False, dtype=np.float64)
data.to_csv('./save.txt', sep=' ’, header=True, index=True, mode='w', encoding='utf-8')
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值