总结一些最近为准备面试而准备的一些知识,今天总结一下python不用Pandas包和用pandas包处理数据集
自定义数据集:
Id,名称,数学,英语,语文
1,xiaohong,98,87,23
.........
#coding=utf8
import pandas as pd
from pandas import DataFrame,Series
#不使用pandas包处理表格数据
dic={}
with open("test.csv",'r') as f:
lines=f.readlines();
line=lines[2:-1]
#计算每个人的总分
#计算每个人不及格的门数
#按总分排名
for lin in line:
li=lin.split(",")
count=sum(int(x) for x in li[1:])
su=sum([1 for x in li[1:] if int(x)<60])
dic[li[0]]=(count,su)
sorted(dic.iteritems(),key=lambda x:x[1][0],reverse=False)
#计算每门功课的最高成绩和姓名
dc={}
lis1={}
lis2={}
lis3={}
for lin in line:
li=lin.split(",")
lis1[li[0]]=int(li[1])
lis2[li[0]]=int(li[2])
lis3[li[0]]=int(li[3])
dc["math"]=lis1
dc["english"]=lis2
dc["chinese"]=lis3
for dic in dc.iteritems():
tmp=dic[1]
mx&