Python实现行转列?!超简单,赶快get起来

前言

数据的行转列操作,在实际工作过程中应用非常广泛。

由于不同人员、不同部门对数据结构的认识是不大相同的,尤其是从基层人员手里拿到的数据,更是五花八门,横七竖八。

比如有这样一张成绩表:

edfdd21a44696b7da956281365277f72.png

乍一看,好像没毛病啊!!

然鹅鹅鹅,当需求:=简单计算一下每个人的总分吧!来临的时候。我脑海中不禁浮想起了:

5cd91094b1d1b4f59e43163d52315a2c.png

安排

# 遇事不要慌,先导个包吧
import pandas as pd
import numpy as np


# 造假数据
data = {'name':['严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
       'subject':['Python','C','SQL','Python','C','SQL','Python','C','SQL'],
       'score':[95,60,95,96,95,80,99,94,88]}


# 生成df
df = pd.DataFrame(data)
df

0b3acb55c533071dabd5d2b443457c03.png

使用pivot方法即可完成行转列哦~语法如下:

#df.pivot(index=None, columns=None, values=None)
df.pivot(index='name',columns='subject',values='score')

2039ece23ae1c118cd03df61e9f2564d.png

cae05057afc4d526704bbfce3bee07b9.png

不要高兴的太早,遇到重复值就麻烦了!少侠请看:

# 造含有重复值的假数据
data1 = {'name':['严小样儿','严小样儿','严小样儿','严小样儿','才华横竖都溢','才华横竖都溢','才华横竖都溢','幽兰幽香','幽兰幽香','幽兰幽香'],
       'subject':['Python','Python','C','SQL','Python','C','SQL','Python','C','SQL'],
       'score':[95,95,60,95,96,95,80,99,94,88]}


df1 = pd.DataFrame(data1)
df1

e8090149f865a905ab02439b1e5c2d50.png

df1.pivot(index='name',columns='subject',values='score')


# 一旦有重复值,就会报错。
ValueError: Index contains duplicate entries, cannot reshape

7b7587548310ad9c324e92db268dd80b.png

7909658ab9dadbcc57ccf45e2b021fe7.png

别急别急,去个重不就可以了吗?!

df1.drop_duplicates().pivot(index='name',columns='subject',values='score')

ef55e38ed0d6581eddeddf9af63c207e.png

方法二:数据透视表

# pivot_table(data, values=None, index=None, columns=None, aggfunc='mean')
pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})

ef9a588ca35a39d986649ae34f20742a.png

聚合

刚刚说了,要求每个人的总分,其实使用透视表就可以完成。

不过,稍微动动脑筋哦。遇到重复值数据的话,只能使用下面的方法一,去重后的数据集,方法一,二都支持。

计算每个人的总分,语法如下:

# 重复数据集也可以
df_pivot = pd.pivot_table(df1,index='name',columns='subject',values='score',aggfunc={'score':'max'})
# 增加一个新列:Total
df_pivot['Total'] = df_pivot.apply(lambda x:np.sum(x),axis = 1)
df_pivot

7b9fe9f9e376cc9cf863f94b5e620223.png

方法二,必须是去重后的数据集,否则会出现计算错误。

# 使用去重数据集才可以
pd.pivot_table(df,index='name',values='score',aggfunc='sum')

b4126995e30994fe020bbfcb3cbe4980.png

# 使用join方法把总分列加进去。
total = pd.pivot_table(df,index='name',values='score',aggfunc='sum')
pd.pivot_table(df,index='name',columns='subject',values='score').join(total)

f0f42c2b73a12f0b080dad0809759472.png

--需求方:算是算出来了,可是,这个score看着怪怪的,能不能改成“总分”呢?

--严小样儿:我改(卑微)!安排~

total1 = pd.pivot_table(df,index='name',values='score',aggfunc='sum').rename({'score':'总分'},axis=1)
pd.pivot_table(df,index='name',columns='subject',values='score').join(total1)

ae10c717a1f55eb3b9c73c37c6c08520.png

行转列,就这样讲完了,大家赶快动手实践一下吧。那么,如何列转行呢?!

!

各位伙伴们好,詹帅本帅假期搭建了一个个人博客和小程序,汇集各种干货和资源,也方便大家阅读,感兴趣的小伙伴请移步小程序体验一下哦!(欢迎提建议)

推荐阅读

牛逼!Python常用数据类型的基本操作(长文系列第①篇)

牛逼!Python的判断、循环和各种表达式(长文系列第②篇)

牛逼!Python函数和文件操作(长文系列第③篇)

牛逼!Python错误、异常和模块(长文系列第④篇)

  • 9
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值