pandas
pands 对excel 的基础操作
import pandas
workbook = pandas.read_excel("pandas.xlsx")#如果这里是.csv就是 read_csv
print(workbook.head())#默认是读取前五行,可以在括号里面设置需要读取的行数#print(workbook.head(3))
print(type(workbook))
print (workbook.dtypes)
print (workbook.columns)#打印列
print (workbook.shape)
关于在excel中筛选出含有特别的字符的表头
col_names = workbook.columns.tolist()#将所有的表头转化为list的形式,
gram_columns = []
for c in col_names:
if c.endswith("(g)"):#筛选出末尾带(g)的表头
gram_columns.append(c)
gram_df = workbook[gram_columns]
print(gram_df.head(1))
pands的计算操作
对列进行+/-/8/ /
简单版
import pandas
workbook = pandas.read_excel("pandas.xlsx")
grade = workbook["成绩"] / 4 # 对指定列(通过表头的名字)进行计算同时也可以进行+/-/*
print (grade)
小拓展-升级版
- == 把计算出来数据导入到excel中新建1列,并保存==
- excel中两列也可以进行计算
import pandas
workbook = pandas.read_excel("pandas.xlsx")
grade = workbook["成绩"] / 4 # 对指定列(通过表头的名字)进行计算同时也可以进行+/-/*
# print (grade)
# print(type(grade))
workbook["折算后"] =grade#把grade中的值传入新建的一列中
workbook.to_excel("pandas.xlsx",index=None)#这里是pandas.xlsx
找一列的最值+均值
max_grade= workbook["成绩"].max()#先定位到某一列,再在这一列进行操作
print(max_grade)
sum_grade= workbook["成绩"].sum()#先定位到某一列,再在这一列进行操作
print(sum_grade)
mean_grade= workbook["成绩"].mean()
print(mean_grade)