批量处理文件夹下面所有txt文件的内容变成unicode编码

import os

def get_all_txt_filepaths_in_directory(directory):
    # 确保提供的路径是一个目录
    if not os.path.isdir(directory):
        print(f"Error: {directory} is not a directory.")
        return []

    # 初始化一个列表来存储所有txt文件的完整路径
    txt_filepaths = []

    # 遍历目录中的所有文件和文件夹
    for filename in os.listdir(directory):
        # 构造文件的完整路径
        filepath = os.path.join(directory, filename)
        
        # 检查文件是否是一个文件并且以.txt结尾
        if os.path.isfile(filepath) and filepath.endswith('.txt'):
            # 将文件的完整路径添加到列表中
            txt_filepaths.append(filepath)

    # 返回包含所有txt文件完整路径的列表
    return txt_filepaths

# 替换为你的目录路径
directory_path = './guan/'
txt_filepaths = get_all_txt_filepaths_in_directory(directory_path)
#对汉字进行unicode编码
def chinese_to_unicode_html(content):
    # 使用列表推导式和ord()函数获取每个字符的Unicode码点,然后转换为HTML实体编码
    return ''.join(f'&#{ord(char)};' for char in content) 
with open('output.txt', 'w', encoding='utf-16') as outfile:
    # 遍历文件名列表
    for name in txt_filepaths:
        # 使用with open打开每个文件,并读取内容
        with open(name, 'r', encoding='utf-16') as infile:
            for line in infile:
                encoded_text = chinese_to_unicode_html(line)
                # 这里我们简单地将"%10;"替换为"\n"(仅换行)
                modified_content = encoded_text.replace("
", "\n")
                # 将修改后的内容写入到新的文件
                outfile.write(modified_content)
                print("文件处理完成,结果已保存到output.txt中。")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

晚来的棠棠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值