前言
相信大家在处理数据过程中,常会遇到将一行数据拆分成多行的需求,比如说一个人的爱好有很多,比如旅游、画画、跳舞、打羽毛球、唱歌;如果要我们计算各种爱好的分布情况,这时就需要把“爱好”字段拆分为多行。这样说大家肯定会觉得不知所云,下面直接进入正文实操部分,相信看完后你就会豁然开朗。
本文将介绍两种常用的方法来解决上面的问题,如果觉得对你有点帮助,请记得点赞+关注。
正文
1、练手数据:
一行变多行.xlsx
9.9K ·
百度网盘
2、问题分析
现在摆在你面前的原数据如下图所示:
需求:统计各个爱好的出现的次数;
问题:一行里出现了多个爱好,无法统计
解决:把“爱好“字段的一行里的种类扩展到多行原始数据→结果数据
3、实操代码
1、方法一:
##一、读数据
df=pd.read_excel('C:/Users/Young/Desktop/一行变多行.xlsx')
df.head()
#二、把“爱好”字段拆分,分为多列
df_name=df['爱好'].str.split('、',expand=True)
df_name
#三、把行转列成列
df_name=df_name.stack()
df_name