import pandas as pd
import numpy as np
import datetime
pd.set_option(‘display.unicode.ambiguous_as_wide’, True)
pd.set_option(‘display.unicode.east_asian_width’, True) # 行列对齐
pd.set_option(‘display.width’, 180) # 设置打印宽度
df = pd.read_excel(“data/scores.xlsx”,header=[0, 1],index_col=0)
header=[0,1]读0,1行并命名索引行0,1,1.
1index_col 默认值(index_col = None)——重新设置一列成为index值
2.index_col=False——重新设置一列成为index值
3.index_col=0——第一列为index(索引)值
直接读取会使文件中第一列数据默认为df的index,使列名和列数据发生错位。可以添加以下参数:index_col
print(df)
print(df.max()) # axis=0在max()中可以忽略,不管哪个轴都有这个,不填默认为0
print(df.min(axis=0))
print(df.max() - df.min()) # 求极差
chazhi = df[‘一本分数线’][‘理科’][2018]-df[‘二本分数线’][‘理科’][2018]
print(chazhi)
print(df.mean().round(2))#求平均值mean,保留两位小数round