pandas--读取文件

最新推荐文章于 2022-04-10 20:39:38 发布

MavenS7

最新推荐文章于 2022-04-10 20:39:38 发布

阅读量276

点赞数

分类专栏： pandas 文章标签： pandas

本文链接：https://blog.csdn.net/MevenS7/article/details/111999374

版权

pandas 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.基本读取

import pandas as pd
people=pd.read_excel('文件路径')
#获取excel表有多少行与列
print('people.shape')
#读取excel表的列名
print(people.columns)
#打印excel表前几行（默认5行）
print(people.head())
#打印excel后几行
print(people.tail())

2.常见情况

#第一行header有脏数据，不是正确的header，header默认是0，此时应该将header设为1
people=pd.read_excel('文件路径',header=1)
print(people.columns)
#当第一行全部是空行的时候，此时是不用写header=1，会默认将空行跳过去的
#如果第一行有部分列是空行的时候，采用的办法仍然是将header=1，解决脏数据造成的header错误。
#当没有header，需要人为的添加header的时候
people=pd.read_excel('文件路径',header=None)
people.columns=['列名1','列名2','列名3']
#此时添加生成的excel文件会多一列 自动生成的index 列
#处理办法
people.set_index('列名1',inplace=True)
print(people.columns)
people.to_excel('文件存放路径') #将文件存储
print('Done')

3.读取文件时指明文件中的index列

import pandas as pd
df=pd.read_excel('文件路径',index_col='列名1')
df.to_excel('保存文件路径')
print('Done')

MavenS7

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录