pandas series列中删除字符串进行计算

Younger0000

已于 2023-12-05 14:15:08 修改

阅读量578

点赞数 8

文章标签： pandas 机器学习数据挖掘 python

于 2023-11-29 22:18:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Younger0000/article/details/134700217

版权

需要对某列进行取mean和std，计算时发现抱错，原来时该列数据中质量不行，含有特定字符串，需要删除后再进行计算

frame = pd.DataFrame({'Y': [41, None, 'ABC', 70, 21.3], 'N': [131, 244, None, 1, 3]})
frame

Y列中含“ABC”在运算前需剔除该数据再进行计算。

第一步使用str.contains来锁定异常行

y = frame["Y"].str.contains("ABC")
print(y)

注意上图，锁定的行为True,其他行为int，nan与字符串“ABC"判定为NaN,所以无法输出的结果直接作为索引去进行选取行，否则会报错。

所以我这里将NaN在做一个.isna()判断，输出一个bool列，就可以直接使用了

这里我们最终要使用的是index 2行，所以再取个反，就是我们真正需要的索引了，如下图

最后使用drop和.index来删除我们选取的行

大功告成！可以进行计算了

一样可以也把None删除了再进行,

（1）空值类型的None。

（2）字符串类型的None，是真实存在的。

第一种直接使用dropna()可以删除

#axis=0: 删除包含缺失值（NaN）的行

#axis=1: 删除包含缺失值（NaN）的列

# how=‘any’ :要有缺失值（NaN）出现删除

# how=‘all’: 所有的值都缺失（NaN）才删除

第二种，直接replace为pandas可读取的空值，如nan，然后再用dropna()去掉即可。

df = df.replace(to_replace='None', value=np.nan).dropna()

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
pandas series列中删除字符串进行计算

注意上图，锁定的行为True,其他行为int，nan与字符串“ABC"判定为NaN,所以无法输出的结果直接作为索引去进行选取行，否则会报错。需要对某列进行取mean和std，计算时发现抱错，原来时该列数据中质量不行，含有特定字符串，需要删除后再进行计算。这里我们最终要使用的是index 2行，所以再取个反，就是我们真正需要的索引了，如下图。所以我这里将NaN在做一个.isna()判断，输出一个bool列，就可以直接使用了。最后使用drop和.index来删除我们选取的行。一样可以也把None删除了再进行。
复制链接

扫一扫

Younger0000 CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

64万+: 周排名

25万+: 总排名

3658: 访问

: 等级

75: 积分

17: 粉丝

22: 获赞

2: 评论

29: 收藏

私信

关注

热门文章

分类专栏

python 数据分析 1篇

最新评论

pandas series列中删除字符串进行计算
CSDN-Ada助手: 很棒的博客！你对使用pandas进行数据处理的方法了如指掌。不过在你的博文中，你可以继续深入介绍一些关于NaN值处理的更多方法，比如fillna()函数来填充NaN值，以及使用str.contains()函数来筛选特定字符串。另外，你也可以介绍一些pandas中关于字符串处理的其他函数，比如str.strip()来去除字符串两端的空格。希望你可以继续分享更多关于数据处理的技巧和经验，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Pandas split报错：The truth value of a Series is ambiguous.
CSDN-Ada助手: 非常感谢您分享关于Pandas split报错的博客，这个问题确实让人头疼。我觉得在下一篇博客中，您可以继续深入探讨Pandas中常见的错误及解决方法，特别是涉及到数据分析和处理的复杂问题。相信这样的技术文章对其他用户也会非常有帮助。希望您能继续分享您的经验和技巧，让更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。