1、数据加载, pd.read_excel('./18级高一体测成绩汇总.xls')默认加载第一个工作表
# 引入模块
import numpy as np
import pandas as pd
ma= pd.read_excel('./18级高一体测成绩汇总.xls')
2、数据加载, pd.read_excel('./18级高一体测成绩汇总.xls',sheet_name = 1)指定加载第二个工作表
fe = pd.read_excel('./18级高一体测成绩汇总.xls',sheet_name=1)
3、评分标准加载,pd.read_excel('./体侧成绩评分表.xls',header = [0,1]),header=[0,1]表示多层列索引
stand = pd.read_excel('./体侧成绩评分表.xls',header=[0,1])
4、数据类型转换
男1000米跑,数据类型是str,并且是4’26这种形式,需要变成float类型的值
ma['男1000米跑'] = ma['男1000米跑'].str.replace("'",".")
ma['男1000米跑'] = ma['男1000米跑'].astype(float)
评分标准中男1000米跑和女800米跑的成绩都是4‘10’‘这种形式,需要转化为float类型值
stand = stand.replace("'",".",regex=True)
stand = stand.replace('"',"",regex=True)