python合并多个txt中的内容到一个txt中

在使用python进行合并多个txt的内容时,使用如下:

with open(filepath,'w') as f:
    f.write(line) 

会导致将原来的filepath中的内容进行覆盖,如何进行不覆盖形式的编写呢,我们可以进行先读行再写的方式(先readlines(),后write),源代码如下,同时还包含将文章中的符号、数字等的去除:

import os
import re
import sys

mefile_name=['D:\\LDA\\LdaStemDocs2\\breast cancer\\','D:\\LDA\\LdaStemDocs2\\colon cancer\\','D:\\LDA\\LdaStemDocs2\\lung cancer\\','D:\\LDA\\LdaStemDocs2\\NHL\\','D:\\LDA\\LdaStemDocs2\\pancreatic cancer\\','D:\\LDA\\LdaStemDocs2\\prostate cancer\\','D:\\LDA\\LdaStemDocs2\\urinary bladder cancer\\']
for i in range(len(mefile_name)):
    for j in range(len(datil_name)):
        meragefiledir=mefile_name[i]+datil_name[j]
        filenames=os.listdir(meragefiledir)
        filestore_name='\\result_.txt'
        with open(filestore_name,'w',encoding='utf-8') as f:
            for filename in filenames:
                filepath=meragefiledir+'\\'
                filepath=filepath+filename
                for line in open(filepath).readlines():
                    line=re.findall(r'[a-zA-Z]+\s+[a-zA-Z\s]*',line)
                    line="".join(line)  
            #print(line)
                    f.write(line+'\n')
            #f.write('\n')
        print('combine {0}{1} ending~~~~~~\n'.format(mefile_name[i],datil_name[j]))
print('ending all')

以上代码删除了原有的open(file)路径,具体根据自己的文件路径进行添加。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值