python 整理txt文件中的格式,按照句号划分句子,形成新的txt

python 整理txt文件中的格式,按照句号划分句子,形成新的txt

# -*- coding:utf-8 -*-
if __name__ == '__main__':
    # 读入需要修改格式的txt
    with open("input/pre_data/one.txt", "r", encoding="utf-8") as f:
        text = f.read().splitlines()
        # 重新写入到一个新txt中
        with open(r"input/pre_data/testz.txt", "w", encoding='utf-8') as r:
            for i in text:
                # 去掉句子中的空格
                i=i.replace(' ','')
                # 给句子换行
                i = i.replace('。', '。\n')
                r.write(i)

    print(text)
    print(type(text))
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 好的,这是一个简单的方法来抽取 txt 格式文件包含关键词的句子: ``` # 首先,我们需要打开文件并读取内容 with open('file.txt', 'r') as f: text = f.read() # 然后,我们可以使用正则表达式来匹配句子 import re pattern = r'(?:[^.!?]|(?<!\d)[.!?]|[.!?](?!\d))+' sentences = re.findall(pattern, text) # 最后,我们可以遍历句子列表并检查是否包含关键词 keyword = '关键词' for sentence in sentences: if keyword in sentence: print(sentence) ``` 这段代码首先打开文件并读取内容,然后使用正则表达式来匹配句子,最后遍历句子列表并检查是否包含关键词。希望这对你有帮助。 ### 回答2: 你可以使用Python的正则表达式库re来抽取txt格式文件包含关键词的句子。以下是一个示例代码: ```python import re # 关键词列表 keywords = ['关键词1', '关键词2', '关键词3'] # 读取txt文件 with open('file.txt', 'r') as file: text = file.read() # 将文本拆句子 sentences = re.split('[。!?]', text) # 遍历每个句子,查找包含关键词的句子 matched_sentences = [] for sentence in sentences: for keyword in keywords: if re.search(keyword, sentence): matched_sentences.append(sentence) break # 打印匹配的句子 for sentence in matched_sentences: print(sentence) ``` 在上述代码,首先定义了一个关键词列表,将需要匹配的关键词添加到列表。然后使用with语句读取txt文件的内容,并将文本拆句子。接下来,通过遍历每个句子,使用正则表达式来查找包含关键词的句子,并将匹配成功的句子添加到`matched_sentences`列表。最后,通过遍历`matched_sentences`列表来打印所有匹配的句子。 你需要将上述代码的`file.txt`替换为你要读取的txt文件路径,并根据实际需求修改关键词列表。 ### 回答3: 可以使用Python编写一个程序来实现抽取txt格式文件包含关键词的句子。以下是一个可能的实现: ```python import re def extract_sentences_with_keywords(file_path, keywords): sentences = [] with open(file_path, 'r') as file: text = file.read() # 将文本按句子割 sentence_list = re.split(r'[。!?]', text) # 遍历每个句子,检查是否包含关键词 for sentence in sentence_list: for keyword in keywords: if keyword in sentence: sentences.append(sentence) break return sentences # 示例用法: file_path = 'example.txt' keywords = ['关键词1', '关键词2', '关键词3'] result = extract_sentences_with_keywords(file_path, keywords) # 输出抽取的句子 for sentence in result: print(sentence) ``` 以上代码实现了一个`extract_sentences_with_keywords`函数,该函数接受文件路径和关键词列表作为输入,返回一个包含抽取的句子的列表。首先,它打开指定文件,并将文件内容读取为文本字符串。然后,它使用正则表达式将文本按句子割成一个句子列表。接下来,它遍历每个句子,并检查是否包含任何关键词。如果找到包含关键词的句子,它将该句子添加到结果列表。最后,该函数返回结果列表。 在使用时,你需要将`file_path`变量设置为你要处理的txt文件的路径,将`keywords`变量设置为你要抽取的关键词列表。最后,你可以遍历`result`列表并打印或使用该列表进行其他操作,以获取抽取的句子

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值