读取数据 header设置Excel无标题头
import pandas as pd
import openpyxl
io = r’C:\Users\Admin\Desktop\missingdata.xlsx’
定位表单,通过表单索引来指定要访问的表单,0表示第一个表单,0/‘student’
也可以采用表单名和索引的双重方式来定位表单 pd.read_excel(path,sheet_name=[0,‘Sheet2’])
自定义最终的列名,一般适用于Excel缺少列名,或者需要重新定义列名的情况。注意:names的长度必须和Excel列长度一致,否则会报错。
https://blog.csdn.net/weixin_38546295/article/details/83537558
df = pd.read_excel(io, sheet_name=0, names=[‘number’, ‘rank’, ‘goal’, ‘penalty’])
获取所有的数据, data.head()获取前五行数据
data = df.head()
data = df.values
0表示第一行 这里读取数据并不包含表头,要注意哦!
data = df.loc[0].values
读取指定多行
data1 = df.loc[[1, 2]].values
读取第2行第3列的值,这里不需要嵌套列表直接输出数值
data_cr = df.iloc[2, 3]
读取第一行和第二行的第2,3列值,这里需要嵌套列表
data_cr1 = df.iloc[[1, 2], [2, 3]]
#读所有行的4,5列的值,这里需要嵌套列表
data_r = df.iloc[:, [2, 3]]
print(data)
print(“输出行号列表:”, df.index.values)
print(“输出列标题:”, df.columns.values)
print(“输出值:\n”, df.sample(3).values) # 输出前三行
print(data_r)
print(data1)
print(“读取指定行数据:\n{0}\n{0}”.format(data,data1))
计算各列的总和
total = df.sum()
print(total)
输出数据基本统计量
statics = df.describe()
print(statics)