Python pandas 替换指定数据

25 篇文章 11 订阅

一、构造dataframe

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])
df.iloc[0,1]=np.nan

在这里插入图片描述

二、替换指定数据(fillna、isin、replace)

1、用"sz"列的同行数据将"bj"列的空值替换掉

df["bj"].fillna(df["sz"],inplace=True)

在这里插入图片描述
2、在1的基础上,将"sz"列为2或者6的数据替换成-4
法一:直接替换

df.loc[df["sz"].isin([2,6]),"sz"]=-4

在这里插入图片描述
法二:函数replace()替换

df.replace({"sz":{2:-4,6:-4}},inplace=True)

在这里插入图片描述

三、替换函数replace()详解

原dataframe如下:
在这里插入图片描述

1、全局替换元素
1)替换单个元素

df.replace(-4,0)#将所有的-4元素替换为0,返回dataframe

在这里插入图片描述
2)替换多个元素
法一:在字典中指定

df.replace({-4:0,4:1})#将-4替换为0,4替换为1

在这里插入图片描述

法二:在列表中指定

df.replace([-4,4],[0,1])#将-4替换为0,4替换为1

在这里插入图片描述
其中法二在列表中指定的方式,如果多个元素替换为相同的值,会更方便。

df.replace([-4,4],1)#将-4和4替换为1

在这里插入图片描述
2、通过指定条件替换元素

df.replace({"bj":{5:10,9:50},"gz":{7:10}})#将"bj"列的5替换为10,9替换为50,将gz列的7替换为10

在这里插入图片描述
也可通过直接索引列的方式来替换指定列的元素

df["bj"].replace({5:10,9:50})#将"bj"列的5替换为10,9替换为50

3、通过模糊条件替换指定元素

法一:通过字符串方法替换 str.replace()

df["bj"]=df["bj"].str.replace("北","南").fillna(df["bj"])#将"bj"列中的"北"字替换成"南"字,若无"北"值,则不替换

在这里插入图片描述
法二:通过正则匹配替换

df.replace("(.*)北(.*)","南京",regex=True)#将"bj"列中的含有"北"字的元素替换成"南京"

在这里插入图片描述

最后,如果需要在原始数据上完成替换,可以通过设置参数inplace=True。

参考链接:
https://blog.csdn.net/qq_18351157/article/details/107141339

  • 39
    点赞
  • 253
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值