python批量转换文件编码

#-*- coding: utf-8 -*-

import codecs
import os
import shutil
import re
import chardet

def convert_encoding(filename, target_encoding):
    # Backup the origin file.
    shutil.copyfile(filename, filename + '.bak')

    # convert file from the source encoding to target encoding
    content = codecs.open(filename, 'r').read()
    source_encoding = chardet.detect(content)['encoding']
    print source_encoding, filename
    content = content.decode(source_encoding) #.encode(source_encoding)
    codecs.open(filename, 'w', encoding=target_encoding).write(content)

def main():
    for root, dirs, files in os.walk(os.getcwd()):
        for f in files:
            if f.lower().endswith('.java'):
                filename = os.path.join(root, f)
                try:
                    convert_encoding(filename, 'utf-8')
                except Exception, e:
                    print filename

def process_bak_files(action='restore'):
    for root, dirs, files in os.walk(os.getcwd()):
        for f in files:
            if f.lower().endswith('.java.bak'):
                source = os.path.join(root, f)
                target = os.path.join(root, re.sub('\.java\.bak$', '.java', f, flags=re.IGNORECASE))
                try:
                    if action == 'restore':
                        shutil.move(source, target)
                    elif action == 'clear':
                        os.remove(source)
                except Exception, e:
                    print source

if __name__ == '__main__':
    # process_bak_files(action='clear')
    main()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
批量修改csv文件编码格式,首先来解释一下编码格式。编码格式是一种将字符转换成二进制数字的规则,不同的编码格式使用不同的规则进行转换。在Python中,我们可以使用csv模块来读取和写入csv文件。 要批量修改csv文件编码格式,我们可以按照以下步骤进行操作: 1. 导入所需的模块:首先,要修改编码格式,我们需要导入csv和codecs模块。csv模块用于读取和写入csv文件,codecs模块用于处理编码格式的转换。 2. 创建一个文件名列表:我们需要获取所有要修改的csv文件文件名列表。可以使用os模块的listdir函数来获取指定目录中的所有文件名。 3. 循环遍历文件名列表:使用一个for循环来遍历文件名列表,并对每个文件进行编码格式的修改操作。 4. 打开文件并读取内容:使用csv模块的reader函数打开csv文件,并通过循环遍历每一行来读取文件内容。 5. 修改编码格式并写入新文件:使用codecs模块的open函数以新的编码格式打开文件,并将读取的每一行写入新文件。 6. 关闭文件:在修改完成后,关闭原来的文件和新文件。 下面是一个示例代码片段,用于批量修改csv文件编码格式为utf-8: ```python import csv import codecs import os # 创建一个文件名列表 file_list = os.listdir("文件夹路径") # 循环遍历文件名列表 for file_name in file_list: # 打开原文件和新文件,使用utf-8编码格式 with codecs.open("文件夹路径/" + file_name, "r", encoding="原编码格式") as csv_file: with codecs.open("文件夹路径/" + file_name + "_new", "w", encoding="utf-8") as new_csv_file: # 读取原文件内容并写入新文件 csv_reader = csv.reader(csv_file) csv_writer = csv.writer(new_csv_file) for row in csv_reader: csv_writer.writerow(row) # 关闭原文件和新文件 csv_file.close() new_csv_file.close() ``` 请注意替换示例代码中的"文件夹路径"为你要操作的文件夹路径,同时将"原编码格式"替换为你的csv文件的当前编码格式。 这就是使用Python批量修改csv文件编码格式的基本步骤。你可以根据具体的需求做一些修改,比如控制文件名的命名规则、处理不同的编码格式等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值