对文件中某一行根据包含的数量进行筛选

LRaby35646

于 2024-05-21 17:30:16 发布

阅读量210

点赞数 5

分类专栏： Python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LiuRuiaby35646/article/details/139097138

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

一、问题阐述
二、解决方法
- 1.将字符串转成列表，进行计数
- 2.针对字符串，直接计数逗号来计算药物数量
总结

一、问题阐述

在这里插入图片描述
想对drug这一列进行判断，如果哪一行drug的数量是1，则将此行删除

二、解决方法

1.将字符串转成列表，进行计数

代码如下（示例）：

import pandas as pd

# 读取CSV文件到DataFrame
df = pd.read_csv('your_file.csv')

# 定义一个函数，用于处理 drug 列中的字符串，strip()是将字符串两端的空格去除
def process_drug_column(drug_str):
    # 去除多余的字符并将字符串转换为列表
    drugs = drug_str.strip('[]').replace("'", "").split(',')
    return [drug.strip() for drug in drugs]

# 应用处理函数到 drug 列
df['drug'] = df['drug'].apply(process_drug_column)

# 过滤出 drug 列中包含多个药物的行
df_filtered = df[df['drug'].apply(len) > 1]

# 保存过滤后的DataFrame到新的CSV文件
df_filtered.to_csv('filtered_file.csv', index=False)

在这里插入图片描述

2.针对字符串，直接计数逗号来计算药物数量

代码如下（示例）：

import pandas as pd

# 读取CSV文件到DataFrame
df = pd.read_csv('/home/yin/DREAMwalk-main/DREAMwalk-main/demo/LiuRui/recall_result/true_disease.csv')

# 过滤出 drug 列中包含多个药物的行（逗号数量大于等于1的行）
df_filtered = df[df['drug'].str.count(',') >= 1]

# 保存过滤后的DataFrame到新的CSV文件
df_filtered

在这里插入图片描述

总结

针对上面两种方法，第二种要求数据格式是规范的且没有额外的复杂情况，所以第一种较为灵活，且生成的数据格式规范。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
对文件中某一行根据包含的数量进行筛选

针对上面两种方法，第二种要求数据格式是规范的且没有额外的复杂情况，所以第一种较为灵活，且生成的数据格式规范。
复制链接

扫一扫

专栏目录

LRaby35646 CSDN认证博客专家 CSDN认证企业博客

码龄1年

28: 原创

9万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

503: 积分

314: 粉丝

229: 获赞

4: 评论

292: 收藏

私信

关注

热门文章

分类专栏

科研项目
Linux 2篇
服务器 2篇
绘图
Python 18篇
模型 1篇
数据挖掘 1篇
Pandas 3篇
机器学习 1篇

最新评论

try...except...的使用
CSDN-Ada助手: 恭喜你写了第13篇博客，标题为“try...except...的使用”！这篇博文非常有用，让读者了解了如何使用try和except来处理异常。希望你能继续保持创作的热情和努力，为读者带来更多有价值的内容。下一步，我建议你可以尝试探讨一些高级的异常处理技巧，或者分享一些实际项目中的应用经验，让读者受益更多。加油！期待你的下一篇博客！
python 的append与extend ； join与” + “；map(function, iterable)与for循环的用法比较
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python 分组的方法
一穷二白到年薪百万: 太厉害啦🤩🤩🤩
python 格式化字符串的方法
CSDN-Ada助手: 恭喜您写了第四篇博客！看了您关于Python格式化字符串的方法的分享，收获颇丰！希望您能继续保持创作的热情和努力，不断提升自己的写作水平。下一步可以考虑深入研究Python中其他常用的格式化方法，或者分享一些实用的编程技巧和经验。期待您的更多精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
python 的append与extend ； join与” + “；map(function, iterable)与for循环的用法比较
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“python 的append、extend 与 join”的比较非常有趣。希望您能继续保持创作的热情，不断探索更多有趣的主题。或许下一步可以尝试探讨其他Python内置函数的用法，或者分享一些实用的编程技巧。期待您的更多精彩文章！祝您写作愉快！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。