android 读取俄文csv乱码_csv 文件读写乱码问题的一个简单解决方法

本文介绍了一个处理CSV文件乱码的自动化方法,通过Python的chardet、pandas库,检测文件原始编码,然后将其转换为UTF-8编码的xlsx文件。提供了一个名为to_utf8的函数用于单个文件转换,以及batch_to_utf8函数进行批量转换。
摘要由CSDN通过智能技术生成

你好,我是 zhenguo

今天扼要总结一个处理csv文件乱码问题,可能你有类似经历,用excel打开一个csv文件,中文全部显示乱码。然后,手动用notepad++打开,修改编码为utf-8并保存后,再用excel打开显示正常。

今天使用Python,很少代码就能将上面过程自动化。首先,导入3个模块:

# coding: utf-8

# @author: zhenguo

# @date: 2020-12-16

# @describe: functions about automatic file processing

import pandas as pd

import os

import chardet

chardet 模块用于得到文件的编码格式,pandas 按照这个格式读取,然后保存为xlsx格式。

获取filename文件的编码格式:

def get_encoding(filename):

"""

返回文件编码格式

"""

with open(filename,'rb') as f:

return chardet.detect(f.read())['encoding']

保存为utf-8编码xlsx格式文件,支持csv, xls, xlsx 格式的文件乱码处理。需要注意,如果读入文件为csv格式,保存时要使用xlsx格式:

def to_utf8(filename):

"&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值