【Python】dataframe两列的字符串和数字拼接，但出现none值则不做处理的方法（案例）

翠花上酸菜

于 2024-07-18 15:23:28 发布

阅读量468

点赞数 16

分类专栏： python dataframe 文章标签： python 开发语言 numpy pandas 数据分析

本文链接：https://blog.csdn.net/meggie35/article/details/140496967

版权

python 同时被 2 个专栏收录

43 篇文章 0 订阅

订阅专栏

dataframe

4 篇文章 0 订阅

订阅专栏

在Python的pandas库中，如果你想遍历DataFrame的所有元素，并对非None值的元素增加某个字段，可以使用applymap函数结合条件表达式来实现。applymap函数允许你将一个函数应用于DataFrame的每个元素。

在这里插入图片描述

以下是一个示例，假设我们有一些公司的报价单，以Dataframe的格式来储存，它的字段有公司名、报价金额、和金额单位的信息。但是这个数据表的格式不全，数据可能会有填漏的部分（有None字段）；

如果遍历dataframe的每一行有缺失的部分，含有None值，则视为无效数据，直接返回None不做处理；

而如果三个信息都全的情况下，只需要拼接金额和金额单位，也就是拼接字符串和数值后，形成新的一列放在dataframe里。最终的结果如图：

在这里插入图片描述先创建一个DataFrame示例：

import pandas as pd
import numpy as np

# 创建一个示例DataFrame
df = pd.DataFrame({
'company': ['A 公司','B 公司',None,'D公司'],
'amount': [120,1400, 1,None],
'amount_unit':['美元','千元','元',None]})

我们要处理的是，遍历DataFrame的所有行，但不对None值进行处理，对行里面没有包含None的部分拼接成新的一列。

可以选择直接for循环，用 iloc[ ] 遍历每一行的元素，然后用if 判断加条件来处理。这个方法这里不展示了。主要展示 applymap函数结合条件表达式的方法，对于处理一整行的数据比较直观，代码也轻便很多。

逻辑：

定义一个函数，处理对行的所有元素做是否为空的判断，如果有空值，则直接返回None值；如果无空值，则进行我们需要的处理
直接将函数放入applymap函数中，这个过程约等于对所有的行进行了for循环。

整体代码如下：

import pandas as pd
import numpy as np

# 创建一个示例DataFrame
df = pd.DataFrame({
'company': ['A 公司','B 公司',None,'D公司'],
'amount': [120,1400, 1,None],
'amount_unit':['美元','千元','元',None]})

# 定义一个函数，对非None值增加字段
def merge_values(row):    
    if pd.isnull(row['company']) or pd.isnull(row['amount']) or pd.isnull(row['amount_unit']):
        return None
    else:
        return  str(row['amount'])+ row['amount_unit'] #后续处理条件

# # 使用applymap应用函数,应用函数到DataFrame的每一行
df['Combined'] = df.apply(merge_values, axis=1)

# 检查结果
print(df)

如果你需要对某些特定列进行操作，也可以使用apply函数，但需要指定axis=0来按行操作：

# # 使用applymap应用函数,应用函数到DataFrame的每一列
df['Combined'] = df.apply(merge_values, axis=0)

翠花上酸菜

关注

16
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录