Pandas-excel

最新推荐文章于 2023-03-29 20:59:07 发布

qq_42013714

最新推荐文章于 2023-03-29 20:59:07 发布

阅读量95

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42013714/article/details/115716767

版权

本文介绍了如何使用Python的pandas库读取Excel文件，特别是当Excel缺少列名或需要自定义列名时的操作。通过`pd.read_excel()`函数结合`sheet_name`参数定位工作表，利用`names`参数设定列名。同时展示了如何获取数据的子集，包括特定行、特定列的值，以及如何进行数据切片。还涵盖了数据统计，如求和与基本统计量的计算。

摘要由CSDN通过智能技术生成

读取数据 header设置Excel无标题头

import pandas as pd
import openpyxl

io = r’C:\Users\Admin\Desktop\missingdata.xlsx’

定位表单，通过表单索引来指定要访问的表单，0表示第一个表单，0/‘student’

也可以采用表单名和索引的双重方式来定位表单 pd.read_excel(path,sheet_name=[0,‘Sheet2’])

自定义最终的列名,一般适用于Excel缺少列名，或者需要重新定义列名的情况。注意：names的长度必须和Excel列长度一致，否则会报错。

https://blog.csdn.net/weixin_38546295/article/details/83537558

df = pd.read_excel(io, sheet_name=0, names=[‘number’, ‘rank’, ‘goal’, ‘penalty’])

获取所有的数据, data.head()获取前五行数据

data = df.head()

data = df.values

0表示第一行这里读取数据并不包含表头，要注意哦！

data = df.loc[0].values

读取指定多行

data1 = df.loc[[1, 2]].values

读取第2行第3列的值，这里不需要嵌套列表直接输出数值

data_cr = df.iloc[2, 3]

读取第一行和第二行的第2,3列值，这里需要嵌套列表

data_cr1 = df.iloc[[1, 2], [2, 3]]

#读所有行的4,5列的值，这里需要嵌套列表
data_r = df.iloc[:, [2, 3]]

print(data)
print(“输出行号列表:”, df.index.values)
print(“输出列标题:”, df.columns.values)
print(“输出值:\n”, df.sample(3).values) # 输出前三行

print(data_r)

print(data1)

print(“读取指定行数据:\n{0}\n{0}”.format(data,data1))

计算各列的总和

total = df.sum()
print(total)

输出数据基本统计量

statics = df.describe()
print(statics)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。