Pandas数据处理全攻略：拆分逗号分隔列的10种方法

最新推荐文章于 2024-12-02 15:25:27 发布

原创

最新推荐文章于 2024-12-02 15:25:27 发布 · 1.5k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

在数据分析的征途中，将DataFrame中的逗号分隔列拆分为多行是一项常见任务。Pandas作为Python中一个强大的数据处理工具，提供了多种灵活的方法来实现这一需求。本文将详细介绍10种不同的技术，帮助你根据具体的数据场景和个人偏好选择合适的方法。

在处理现实世界的数据时，我们经常遇到需要将字符串列表转换为行的情况。例如，从API获取的数据或者CSV文件中，某些列可能包含逗号分隔的值。Pandas库提供了多种方式来处理这类数据，使其更加易于分析。

示例 DataFrame

假设我们有以下DataFrame，其中values列包含逗号分隔的字符串：

import pandas as pd

df = pd.DataFrame({
   
   
    'id': [1, 2],
    'values': ['a,b,c', 'd,e']
})

方法1：使用 `explode()`

explode() 是Pandas中专门用于将Series中的列表拆分为多行的函数。

df_exploded = df.explode('values')

优点： 代码简洁，执行效率高。
缺点： 需要Pandas 0.23.0及以上版本。

方法2：使用 `apply()` 和 `split()`

apply() 函数允许对DataFrame的列应用自定义函数。

df_exploded = df.apply(lambda x: pd.Series({
   
   'id': x['id'], 'values': x['values'].split(',')}), axis=1).explode('values').reset_index(drop=True)
</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

蜗牛沐雨

关注关注

13
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

pandas笔记之分列

瓜瓜的笔记

05-22

1938

分列方法一览文章目录分列方法一览split()有分裂键extract()无分列键 split()有分裂键 str.split()有三个参数：第一个参数就是引号里的内容：就是分列的依据，可以是空格，符号，字符串等等。第二个参数就是前面用到的expand=True，这个参数直接将分列后的结果转换成DataFrame。第三个参数的n=数字就是限制分列的次数。默认从右边进行分列如果从左边分列的话可以用 rsplit() ，用法与split()相同根据"-"进行分列 df["列名"].str.split(

Pandas中的数据拆分成组—groupby()方法

KJ.JK

11-23

9667

在Pandas中，可以通过groupby()方法将数据集按照某些标准划分成

参与评论您还未登录，请先登录后发表或查看评论

Pandas实现一列数据分隔为两列

09-16

主要介绍了Pandas实现一列数据分隔为两列，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

Pandas：一列拆分为多列

opp003的博客

05-08

1万+

假设dataframe中有一列数据为如下形式：需要将YEAR_UNIT_DEPOSIT_PRO这一列的数据按照指定分隔符‘|’拆分为12列，并拼接到原始数据中生成新的dataframe。方法如下： # 数据拆分、拼接 new_names = ['gjj_pro_' + str(x + 1) for x in range(12)] # 为新生成的列取名 gjj_pro = gjj_...

pandas分列

xu_xiaoxu的博客

10-26

1743

data.insert(1,'city',data['address']) #先复制原来的列 data["address"] = data["address"].map(lambda x:x.split()[0]) #分别处理新旧两列 data["city"] = data["city"].map(lambda x:x.split()[1]) ...

python数据处理：拆分到行

xfz_0616的博客

08-29

801

python数据处理：拆分到行附：Excel--Power Query

Pandas：⼀列拆分为多列

LuckyTHP

04-27

1468

假设dataframe中有⼀列数据为如下形式：需要将YEAR_UNIT_DEPOSIT_PRO这⼀列的数据按照指定分隔符‘|’拆分为12列，并拼接到原始数据中⽣成新的dataframe。⽅法如下：数据拆分、拼接 gjj_pro = gjj_pboc['YEAR_UNIT_DEPOSIT_PRO'].str.split('|', expand=True) # 将数据按‘|’拆分 gjj_pro_col_len=gjj_pro.shape[1]#拆分出的列数 new_names = ['gjj_pro

【数据处理】pandas DataFrame 实现某列中分隔数据转成多行 split explode

scxyz的博客

04-23

1万+

DataFrame中某列由“逗号”分隔，格式如下。希望转换后，分隔的行全部以列的形式重新排列。处理前：处理后：转换代码如下。 import pandas as pd df = pd.DataFrame([{'var1': 'a,b,c', 'var2': 1}, {'var1': 'd,e', 'var2': 2}]) df1 = pd.concat...

在Pandas中展开DataFrame列中的字符串至多行的五种方法

热门推荐

SCUT_Sam

07-27

4万+

摘要：本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。这个是我们的数据集(data)，可以看到，数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|’分割。我们要把用每个‘|’进行分割的内容抽取出来。 pandas有个一步到到位的方法，非常方便。 import pandas as pddata['name'].str.split(

Pandas一列分成两列

dta0502的博客

10-07

2万+

文章目录分割成一个包含两个元素列表的列分割成两列，每列包含列表的相应元素分割成一个包含两个元素列表的列对于一个已知分隔符的简单分割（例如，用破折号分割或用空格分割） .str.split()方法就足够了。它在字符串的列（系列）上运行，并返回列表（系列）。 >>> import pandas as pd >>> df = pd.DataFrame({'AB...

pandas如何将一行拆分为多行，一列拆分为多列

weixin_44214830的博客

11-04

1万+

今天在工作中遇到要将pandas数据框的一行拆成多行，和一列拆为多列的需求，一台服务器中可以有多个网卡，每个网卡都有状态，通过网卡的上下行流量。下面以一组“数据”为例，来说一下pandas如何将一行拆分为多行，一列拆分为多列。需求如下图思路： 1.先将(0,c)拆成一个数据框 2.再将新数据框拆成4列(list1,list2,list3,list4) 3. 将原始数据框的c列删除，合并两个数据框 import numpy import pandas as pd from tab..

Python pandas数据分列，分割符号&固定宽度

DataShare

09-30

5489

背景数据分列在数据处理中很常见，数据分列一般指的都是字符串分割，这个功能在Excel里面很实用，处理数据非常方便，那么在pandas数据框中怎么使用呢，今天这篇文章就来详细介绍下分列模拟数据以下面这9行数据作为案例来进行处理模拟数据读取数据 #加载库 import pandas as pd #读取数据 data=pd.read_excel('data.xlsx')...

[Pandas] 一列文本分割成多列

Hudas的博客

06-05

869

本文主要讲解使用Pandas将一列文本分割成多列文本的技巧知识

pandas拆分行

qq_22483767的博客

05-10

327

pandas拆分行 import pandas as pd from sqlalchemy import create_engine dat=pd.read_excel(r'C:\Users\z\Desktop\test.xlsx',sheet_name='Sheet4') dat A B 0 A1 B1,B2 dat1=pd.Series(dat['B']

【pandas】将单元格中的多个数据拆分为多行数据(explode)，以csv文件为源文件进行处理

qq_45067943的博客

03-04

2963

【pandas】将单元格中的多个数据拆分为多行数据(explode) 1.原始数据（test.csv） 2.需求将“别名”、“科目”这两列中带有多个数据的单元格拆分成多行数据，并将带有空值的行删除，然后另存储为csv文件 3.代码 import pandas as pd import numpy as np #导入数据 data = pd.read_csv('test.csv') #将单元格中的多个数据拆分为多行数据（用explode方法） labels = ['别名','科目'] for la

python pandas 分割DataFrame中的字符串及元组

侯小啾技术博客

03-09

1万+

使用str.split()方法使用join()与split()方法结合使用apply方法分割元组

python中pandas库处理excel进行列拆分

04-21

，你能教我如何实现吗？当然可以。你可以使用pandas库中的str.split()方法，将需要拆分的列名传入该方法，并指定分隔符（例如逗号、分号等），生成一个包含拆分后数据的Series对象。接着，可以将这个Series对象赋值给新的列，从而实现列的拆分。例如： ```python import pandas as pd # 读取excel文件 df = pd.read_excel('data.xlsx') # 拆分‘姓名’列 df['姓'], df['名'] = df['姓名'].str.split(' ', 1).str # 输出结果 print(df) ``` 这样，就可以将‘姓名’列按照空格拆分成‘姓’和‘名’两列。

Pandas数据处理全攻略：拆分逗号分隔列的10种方法

示例 DataFrame

方法1：使用 explode()

方法2：使用 apply() 和 split()

方法1：使用 `explode()`

方法2：使用 `apply()` 和 `split()`