python pandas读取或写入文件

Chipeyown

已于 2022-12-21 17:13:07 修改

阅读量5.2k

点赞数 5

分类专栏：数据处理文章标签： pandas python3 读取excel 写入excel

于 2019-04-13 15:40:02 首次发布

本文链接：https://blog.csdn.net/weixin_43745169/article/details/89283595

版权

数据处理专栏收录该内容

10 篇文章

订阅专栏

pandas 读取文件

pandas读取文件常用方法有：

函数	说明
read_csv	读取csv文件，默认分割符号为逗号
read_excel	读取xlsx文件，默认分割符号为空格
read_table	可读取常见的各种文本文件，默认分隔符为’\t’
read_clipboard	从粘贴板上读取数据
这些命令的用法和R语言上面的风格很相似。

pandas读取excel表

首先，我在桌面上自己创建了一个excel表格：
路径为：C:\Users\Chipeyown\Desktop\data.xlsx
内容为：
excel表格的内容
然后，通过read_excel命令读取该excel表格

import pandas as pd
df=pd.read_excel(r'C:\Users\Chipeyown\Desktop\data.xlsx')
print(df)

输出结果为：

type one two three
0 a 1 5 9
1 b 2 6 10
2 c 3 7 11
3 d 4 8 12

发现系统帮忙给建了一个index
我们也可以通过index_col这个参数，自己设定想要的index

df=pd.read_excel(r'C:\Users\Chipeyown\Desktop\data.xlsx',index_col='type')
print(df)

输出结果为：

one two three
type
a 1 5 9
b 2 6 10
c 3 7 11
d 4 8 12

“type”字符可以忽略，它对dataframe没有任何影响

读取文件时常用的各种参数：

参数	解释
sep=‘’	设定分隔符
header=	header=0，即以第一行为表头，header=None，即没有表头
names=[‘one1’,‘one2’,‘one3’]	重新设定columns的label，结合header=None使用
skiprows = 2	跳过文件的前两行，读取后面剩余的行
skiprows=[1,2]	跳过行号为1，2的两行，即a,b两行
skip_footer=2	跳过文件的最后两行，读取后面剩余的行
nrows= 3	只读前3行
index_col= [‘type’]	设定type这一列为index
usecols=[‘one’,‘two’]	只使用‘one’,'two’这两列
na_values= ‘NULL’	将数据中的noll值识别为空值
sheet_name= ‘sheet1’	读取excel表格中的指定sheet
dtype= {‘column1’:str,‘column2’:float}	指定某列的数据类型

pandas写入excel表

写入是通过to_excel命令来完成的

df.to_excel(r'C:\Users\Chipeyown\Desktop\data1.xlsx')

然后就可以在桌面上找到保存下来的excel表格。该表格不需要提前建立。
内容为：
保存下来的文件的内容
各种参数也和读取时的类似
若要将多个dataframe保存至一个excel的不同sheet，可参照一下脚本：

writer=pd.ExcelWriter('Results.xlsx')
df1.to_excel(writer,sheet_name='sheet1',index=None)
df2.to_excel(writer,sheet_name='sheet2',index=None)
writer.save()