前言
使用python将CSV文件由ANSI编码转换为utf-8格式,保持中文不乱码
提示:以下是本篇文章正文内容,下面案例可供参考
一、针对什么问题解决?
此方法解决的是使用Notepad++软件打开大的CSV文件时汉字显示正常但是在jupyter读取时不正常的问题,使用前提是确保自己的数据格式为ANSI格式下文字保持正常,可在Notepad++软件中查看CSV文件格式
二、使用步骤
代码如下(示例):
import codecs
# 输入文件和输出文件的路径
input_file_path = 'input_file.csv'
output_file_path = 'output_file_utf8.csv'
# 打开 ANSI 编码的 CSV 文件进行读取,以 UTF-8 编码方式打开新文件进行写入
with open(input_file_path, 'r', encoding='ansi') as input_file, \
open(output_file_path, 'w', encoding='utf-8') as output_file:
# 逐行读取并逐行写入
for line in input_file:
output_file.write(line)
总结
以上就是今天要讲的内容,本文仅仅介绍了大的CSV文件时汉字显示正常但是在jupyter读取时不正常问题,使用前确保自己的数据在ANSI格式下文字保持正常