将下载的小说,批量转换成UTF-8编码格式

将下载的小说,批量转换成UTF-8编码格式。

import os

def simple_progress_bar(iterable, total=None, desc=''):
    total = total or len(iterable)
    for index, item in enumerate(iterable, 1):
        print(f'\r{desc} [{index}/{total}]', end='')
        yield item
    print()

def try_encodings(filepath, encodings):
    for encoding in encodings:
        try:
            with open(filepath, 'r', encoding=encoding) as f:
                content = f.read()
            return encoding, content
        except UnicodeDecodeError:
            continue
    return None, None

def convert_encoding(src_folder, dst_encoding='UTF-8'):
    encodings_to_try = ['GB2312', 'UTF-8', 'ISO-8859-1']
    txt_files = [os.path.join(root, file) for root, _, files in os.walk(src_folder) for file in files if file.endswith('.txt')]
    for filepath in simple_progress_bar(txt_files, total=len(txt_files), desc='Converting'):
        src_encoding, content = try_encodings(filepath, encodings_to_try)
        if src_encoding:
            with open(filepath, 'w', encoding=dst_encoding) as f:
                f.write(content)
        else:
            print(f"Unable to determine encoding for file {filepath}. Skipping...")

src_folder = '/Users/xxx/Downloads/temp'  # 修改这里为你的文件夹路径
convert_encoding(src_folder)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值