在Python中获取txt文本中特殊字符之间包含关键词的段落脚本

修Bug的阿良

已于 2022-10-10 21:44:50 修改

阅读量1k

点赞数

文章标签： python pycharm

于 2022-10-10 21:42:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/No_Error_1/article/details/127252877

版权

问题描述

由于在数据预处理中遇到了一些问题，在网上查找资料大多是关于用python截取txt文件中两个特殊字符之间的整个段落，但是我需要截取段落之间有关键字HUMAN的段落，所以写了如下脚本。

dd = open("result.txt", 'a')

d = open("test.txt", 'r')

wflag = False #设置bool值
newline = []
for line in d:
    if ">" in line:  # 遇到>时，说明已经到了新的区域，写标记置否
        wflag = False
    if ">" in line and "HUMAN" in line:  # 遇到>,且有HUMAN时，设置写标记为Ture
        wflag = True
        # continue   #如果要舍弃作判断的那一行，则contine进行下一轮循环
    if wflag == True:
        K = list(line)
        for i in K:  # 写入需要内容
            newline.append(i)

strlist = "".join(newline)  # 合并列表元素
newlines = str(strlist)  # list转化成str

dd.write(newlines)


d.close()
dd.close()

结果：

test文件（这里我随意写了一个文件包含我所需要的条件）：

>123HUMAN...
wdewdeqw
>djwdefocl;LCMKDNVC
duqwudie
cswwwedwde
>CEUWQLF_HUMAN
dwqdwefc
xsdefd
>12defew

result文件

截取到包含我要的关键字HUMAN的段落。

参考文章：

(15条消息) 提取TXT文本中指定内容——python_MENG_痴痴的博客-CSDN博客_python提取txt中指定内容

修Bug的阿良

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

修Bug的阿良 CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

117万+: 周排名

206万+: 总排名

1万+: 访问

: 等级

73: 积分

504: 粉丝

19: 获赞

4: 评论

66: 收藏

私信

关注

热门文章

最新评论

连接linux服务器报错fork: retry: No child processes解决方案
jinjinjin_7: 请问为什么会出现这种情况，是中病毒了吗
glibc2.17升级到glibc2.18版本不兼容问题，重新降版本回到glibc2.17
CSDN-Ada助手: 非常感谢您的持续创作，标题看起来非常有趣！恭喜您成功解决glibc2.17升级到glibc2.18版本时遇到的不兼容问题，并重新降级回到glibc2.17。这篇博客对于那些遇到相似问题的读者来说一定非常有帮助。不过，我想提一些建议，希望对您的下一篇创作有所帮助。或许您可以进一步探讨一下glibc2.17和glibc2.18之间的主要区别，并分享一些升级的可能方法或替代方案。这样的话，读者们就可以更全面地了解如何处理类似的兼容性问题。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
pytorch笔记--softmax回归，李沐课程代码注释
Akuma521: 所以说这里面的isinstance(net, torch.nn.Module)是false阿，李牧这么写是因为后面会用到nn.Moudule，但这一节是没用到。
pytorch笔记--softmax回归，李沐课程代码注释
weixin_46059925: if isinstance(net,torch.nn.Module):#isinstance()函数来判断一个对象是否是一个已知的类型，isinstance() 会认为子类是一种父类类型，考虑继承关系。这里为啥net和nn.module就算一个类型呢？net是一个自己定义的函数，nn.module是本身就有的，为啥他们是一个类型呢？
pytorch笔记--softmax回归，李沐课程代码注释
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。