怎么利用python解决csv文件读写乱码问题?今天番茄加速就来说一下。
首先,导入3个模块:
# coding: utf-8
# @author: zhenguo
# @date: 2020-12-16
# @describe: functions about automatic file processing
import pandas as pd
import os
import chardet
chardet 模块用于得到文件的编码格式,pandas 按照这个格式读取,然后保存为xlsx格式。
获取filename文件的编码格式:
def get_encoding(filename):
"""
返回文件编码格式
"""
with open(filename,'rb') as f:
return chardet.detect(f.read())['encoding']
保存为utf-8编码xlsx格式文件,支持csv, xls, xlsx
格式的文件乱码处理。需要注意,如果读入文件为csv格式,保存时要使用xlsx格式:
def to_utf8(filename):
"""
保存为 to_utf-8
"""
encoding = get_encoding(filename)
ext = o