批量修改文件编码方式为utf-8,批量合并多个txt文件为一个

今天想整理一下笔记,需求是把一个文件夹下的多个txt文件整合成一个,在整合过程中出现编码不一致,报错了,所以我整理了一下,分享出来,也方便我下次要用的时候
思路:
1.先统一编码
2.再执行文件合并
下面是代码部分,做了注释,方便套用
引用的第三方库请自行安装

1、统一编码方式为utf-8

import os

from chardet import detect

#需要把这个文件放在你要改编码格式的文件夹下

fns = []

filedir = os.path.join(os.path.abspath('.'))

file_name = os.listdir(os.path.join(os.path.abspath('.')))

for fn in file_name:
    
    if fn.endswith('.txt'):  # 这里填文件后缀
        
        fns.append(os.path.join(filedir, fn))
 
for fn in fns:
    
    with open(fn, 'rb+') as fp:
        
        content = fp.read()
        
        codeType = detect(content)['encoding']
        
        content = content.decode(codeType, "ignore").encode("utf8")
        
        fp.seek(0)
        
        fp.write(content)
        
        print(fn, ":已修改为utf8编码")

2、将一个文件夹内多个txt文件合并为一个 代码

import os

dirPath = "C:\\Users\\25801路西\\Desktop\\课程视频代码" #所有txt位于的文件夹路径,自行修改

files = os.listdir(dirPath)

res = ""

i = 0

for file in files:
    
    if file.endswith(".txt"):#可以修改为其他的文件后缀,就能达到其他文件的批量合并效果
        
        i += 1
        
        title = "第%s节 %s" % (i, file[0:len(file)-4])
 
        with open("C:\\Users\\25801路西\\Desktop\\课程视频代码\\" + file, "r", encoding='utf-8') as file:#需要修改文件路径

            content = file.read()
            
            file.close()
 
        append = "\n%s\n\n%s" % (title, content)
        
        res += append
 
with open("C:\\Users\\25801路西\\Desktop\\课程视频代码\\outfile.txt", "a+", encoding='utf-8') as outFile:#需要修改文件路径

    outFile.write(res)

    outFile.close()
    
print(len(res))

到这里就结束了,感谢你的阅读

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值