Pandas-excel

本文介绍了如何使用Python的pandas库读取Excel文件,特别是当Excel缺少列名或需要自定义列名时的操作。通过`pd.read_excel()`函数结合`sheet_name`参数定位工作表,利用`names`参数设定列名。同时展示了如何获取数据的子集,包括特定行、特定列的值,以及如何进行数据切片。还涵盖了数据统计,如求和与基本统计量的计算。
摘要由CSDN通过智能技术生成

读取数据 header设置Excel无标题头

import pandas as pd
import openpyxl

io = r’C:\Users\Admin\Desktop\missingdata.xlsx’

定位表单,通过表单索引来指定要访问的表单,0表示第一个表单,0/‘student’

也可以采用表单名和索引的双重方式来定位表单 pd.read_excel(path,sheet_name=[0,‘Sheet2’])

自定义最终的列名,一般适用于Excel缺少列名,或者需要重新定义列名的情况。注意:names的长度必须和Excel列长度一致,否则会报错。

https://blog.csdn.net/weixin_38546295/article/details/83537558

df = pd.read_excel(io, sheet_name=0, names=[‘number’, ‘rank’, ‘goal’, ‘penalty’])

获取所有的数据, data.head()获取前五行数据

data = df.head()

data = df.values

0表示第一行 这里读取数据并不包含表头,要注意哦!

data = df.loc[0].values

读取指定多行

data1 = df.loc[[1, 2]].values

读取第2行第3列的值,这里不需要嵌套列表直接输出数值

data_cr = df.iloc[2, 3]

读取第一行和第二行的第2,3列值,这里需要嵌套列表

data_cr1 = df.iloc[[1, 2], [2, 3]]

#读所有行的4,5列的值,这里需要嵌套列表
data_r = df.iloc[:, [2, 3]]

print(data)
print(“输出行号列表:”, df.index.values)
print(“输出列标题:”, df.columns.values)
print(“输出值:\n”, df.sample(3).values) # 输出前三行

print(data_r)

print(data1)

print(“读取指定行数据:\n{0}\n{0}”.format(data,data1))

计算各列的总和

total = df.sum()
print(total)

输出数据基本统计量

statics = df.describe()
print(statics)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值