pandas中，利用groupby分组后，对字符串字段进行合并拼接

最新推荐文章于 2024-04-28 21:22:27 发布

Jepson2017

最新推荐文章于 2024-04-28 21:22:27 发布

阅读量2.7w

点赞数 40

分类专栏： Python学习笔记文章标签： python

本文链接：https://blog.csdn.net/d1240673769/article/details/106038811

版权

Python学习笔记专栏收录该内容

58 篇文章 14 订阅

订阅专栏

在pandas里对于数值字段而言，groupby后可以用sum()、max()等方法进行简单的处理，对于字符串字段，如果把它们的值拼接在一起，可以用使用 str.cat() 和 lamda 方法。

如，将下面表格中的内容，对skill字段按照id进行分组合并
在这里插入图片描述
实现代码：

import pandas as pd

file_name='test.xlsx'

df=pd.read_excel(file_name)
data=df.groupby('id')['skill'].apply(lambda x:x.str.cat(sep=':')).reset_index()
print(data)

效果如下：

在这里插入图片描述

另，数据处理时，常常需要将某一列进行拆分，分列，替换等，相关的函数有str.split()、str.extract()、str.replace().
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Jepson2017

关注关注

40
点赞
踩
96

收藏

觉得还不错? 一键收藏
打赏
6
评论
pandas中，利用groupby分组后，对字符串字段进行合并拼接

在pandas里对于数值字段而言，groupby后可以用sum()、max()等方法进行简单的处理，对于字符串字段，如果把它们的值拼接在一起，可以用使用 str.cat() 和 lamda 方法。如，将下面表格中的内容，对skill字段按照id进行分组合并实现代码：import pandas as pdfile_name='test.xlsx'df=pd.read_excel(file_name)data=df.groupby('id')['skill'].apply(lambda x:
复制链接

扫一扫