文件转换为utf-8编码(python小脚本)

本人windows环境,平时从数据库导出数据或者从网上下载csv或txt数据后,会发现各种编码格式。导致有时候打开文件会乱码。为了方便,把文件统一改为utf-8编码,这样就减少了很多麻烦。

故写个python小脚本,解决麻烦。以下为思路:

  1. 在桌面建立空白文件夹,把需要转换编码的文件拖到里面;
  2. 读取文件夹所有文件;
  3. 然后以utf-8编码保存文件。

以下为python 脚本;

# 更改文件编码
# 文件统一改为utf-8无BOM
# -*- coding: UTF-8 -*-
import os
import pandas as pd

#需要把文件改成编码的格式(可以自己随时修改)
coding = 'utf-8_sig' 
# 文件夹目录(可以更改文件编码的文件夹~)
file_dir = 'C:\\Users\\yimian\\Desktop\\更改文件编码' 

def run_coding():
    for root, dirs, files in os.walk(file_dir, topdown=False):
        for i in files:
            files_name = os.path.join(root, i)
            try:
                df1 = pd.read_csv(files_name, encoding='utf-8') 
            except:
                df1 = pd.read_csv(files_name, encoding='gbk')
            df1.to_csv(files_name, encoding=coding,index=None)

if __name__ == '__main__':
    run_coding()
    print("It's done")

一般window环境常见的是gbk和utf-8两种编码,所有可以满足平时基本需求。

使用之前:

  1. 右键文件;
  2. 以notepad++打开;
  3. 更改文件编码;
  4. 保存。

使用脚本:

  1. 把文件拖到文件夹;
  2. 运行脚本~OK;

平时就一个文件要更改时,两种方式都可以,
当需要更改的文件数量比较多时,就必需要用脚本了~

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值