Python提取文本文档内容

网上查找资料,修修改改。能够提取出来关键字,数量

问题一:提取出来的关键字,对应文本文档路径要怎么实现。目前输出的是全部的文本路径

import re
from pathlib import Path

##读取文本内容
def main():
    txts = []
    for p in Path(import_path).rglob("*.txt"):
        #print(type(p))
        list_file = p.joinpath()
        route_file = str(list_file)
        #保存路径
        r_files.write(route_file + '\n')
        with list_file.open('rb') as f:
            lines = f.readlines()
            for line in lines:
                txts.append(line)
            f.close()
    txts = str(txts) ##转换数据类型
    ##提取手机号码
    number = re.findall(r'(?:13[0-9]|14[01456879]|15[0-35-9]|16[2567]|17[0-8]|18[0-9]|19[0-35-9])\d{8}',txts)   
    with open(save_path, 'w') as save_file:
        for num in number:
            save_file.write(num + '\n')
        save_file.write('\nTotal numbers: ' + str(len(number)))
        print('Number read OK, total number: ' + str(len(number)))
        save_file.close()

if __name__ == '__main__':
    import_path = r"D:\python\"
    save_path = input("请输入保存的路径: ")
    r_files = open('扫描目录.txt','w')
    main()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值