# 一旦有重复值,就会报错。ValueError: Index contains duplicate entries, cannot reshape
别急别急,去个重不就可以了吗?!
df1.drop_duplicates.pivot( index= 'name',columns= 'subject', values= 'score')
方法二:数据透视表
# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean')pd.pivot_table(df1, index= 'name',columns= 'subject', values= 'score',aggfunc={ 'score': 'max'})
聚合
刚刚说了,要求每个人的总分,其实使用透视表就可以完成。
不过,稍微动动脑筋哦。遇到重复值数据的话,只能使用下面的方法一,去重后的数据集,方法一,二都支持。
计算每个人的总分,语法如下:
# 重复数据集也可以df_pivot = pd.pivot_table(df1, index= 'name',columns= 'subject', values= 'score',aggfunc={ 'score': 'max'})# 增加一个新列:Totaldf_pivot[ 'Total'] = df_pivot.apply(lambda x:np.sum( x),axis = 1)df_pivot
方法二,必须是去重后的数据集,否则会出现计算错误。
# 使用去重数据集才可以pd.pivot_table(df, index= 'name', values= 'score',aggfunc= 'sum')
# 使用join方法把总分列加进去。total = pd.pivot_table(df, index= 'name', values= 'score',aggfunc= 'sum')pd.pivot_table(df, index= 'name',columns= 'subject', values= 'score').join(total)
--需求方:算是算出来了,可是,这个score看着怪怪的,能不能改成“总分”呢?
--严小样儿:我改(卑微)!安排~
total1= pd.pivot_table(df,index= 'name',values= 'score',aggfunc= 'sum').rename({ 'score': '总分'},axis= 1)pd.pivot_table(df,index='name',columns='subject',values='score').join(total1)
行转列,就这样讲完了,大家赶快动手实践一下吧。那么,如何列转行呢?!
提供300分钟视频讲解,教学大纲、课件、教案、习题答案、程序源码等配套资源。
扫码,优惠购书
凡是在京东购书的用户,可以将订单信息和评价发到itbook8@163.com,将会获取超值大礼包(包括案例源码,超多的视频教程,数据集等资源)返回搜狐,查看更多