用python处理excel数据赢得比赛_用python处理excel数据(二)读取excel

这篇博客介绍了使用Pandas进行数据分析的基本操作,包括读取Excel文件,查看数据属性如行数和列名,显示数据的前几行和后几行。还详细讲解了如何处理没有表头的情况,如设置表头和索引,并展示了如何保存处理后的数据到新的Excel文件。最后提到了在读取已有索引的Excel文件时,如何避免默认索引的显示。
摘要由CSDN通过智能技术生成

小白的数据分析学习之路.我是小白.加油!

import pandas as pd

#read_excel()用来读取excel文件,记得加文件后缀

data = pd.read_excel('C:/tmp/002/People.xlsx')

print('显示表格的属性:',data.shape) #打印显示表格的属性,几行几列

print('显示表格的列名:',data.columns) #打印显示表格有哪些列名

#head() 默认显示前5行,可在括号内填写要显示的条数

print('显示表格前三行:',data.head(1))

print('--------------------------华丽的分割线----------------------------')

#tail() 默认显示后5行,可在括号内填写要显示的条数

print('显示表格后五行:',data.tail())

-----------20200120

1、读取excel文件

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle) #此处会全部打印出来,如果行数特别多一般不会允许全部打印出来

2、显示表格的属性 .shape 属性

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle.shape) #读取excel表有多少行多少列 也就是表格的属性

3、显示列数 .columns

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle.columns)#显示表格列数 注意columns不会自动联想出来

4、显示前6行.head()

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle.head(6))#默认显示前五行

5、显示后6行.tail()

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle.tail(6))#默认显示后五行

6、表格首行为无效数据 或 表格首行为空 ,header=1

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=1)

print(rdexcle.head())

7、表格无表头,加上表头

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx')

print(rdexcle.columns)

可以用header=None,告诉我们不设表头,用整数帮我们生成 0,1

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=None)

print(rdexcle.columns)

但是这样显示也不对,要加上表头,用.columns ,这样表头就设置好了

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=None)

rdexcle.columns=['ID','NAME']#设置表头

print(rdexcle.columns)

然后再将其保存

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=None)

rdexcle.columns=['ID','NAME']#设置表头

print(rdexcle.columns)

rdexcle.to_excel('F:/Practice/py/practise_01_out.xlsx')

print('Done!')

但是打开后,还显示索引部分

可以用set_index()

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=None)

rdexcle.columns=['ID','NAME']#设置表头

rdexcle = rdexcle.set_index('ID') # 设置id为索引,生成一个新的dataframe,用rdexcel继续引用这个新的。

print(rdexcle.columns)

rdexcle.to_excel('F:/Practice/py/practise_01_out.xlsx')

print('Done!')

也可以用,rdexcle.set_index('ID',inplace=True) 表示 在当前表上修改。不用再新建表

import pandas as pd

rdexcle = pd.read_excel('F:/Practice/py/practise_01.xlsx',header=None)

rdexcle.columns=['ID','NAME']#设置表头

rdexcle.set_index('ID',inplace=True)

print(rdexcle.columns)

rdexcle.to_excel('F:/Practice/py/practise_01_out.xlsx')

print('Done!')

8、再次重新读取刚才生成的excel时 还会显示默认index。有一个办法是,再后边加上index_col='ID' 也就是你知道的本表中的索引。

import pandas as pd

df =pd.read_excel('F:/Practice/py/practise_01_out.xlsx')

print(df.head())

import pandas as pd

df =pd.read_excel('F:/Practice/py/practise_01_out.xlsx,index_col='ID' ')

print(df.head())

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值