在使用pandas库打开csv文件时,发生了如标题所示的报错
data = pd.read_csv("data.csv")
该报错的意思是利用utf-8编码阅读该文件时无法正确进行阅读,并且可能会产生乱码,因此发生报错。为了解决该错误,在网上搜集资料后得出,应当修改csv文件的格式。
而由于作者是mac电脑,无法像windows系统一样直接选择utf-8格式的文件,因此总结出以下方法
1.用vscode打开该文件,底下一行会显示编码方式,选择UTF-8时可以看到文件为乱码
因此点击编码,选择通过编码重新打开
选择GB 2312这个选项,即可出现正常的文字版本
随后,复制文件内容,重新选择UTF-8版本,并进行粘贴,保存后就可以得到没有乱码的UTF-8版本的数据文件啦。pandas库也可以正常读取了。
参考的方法链接附在这里了vscode utf-8 中文乱码怎么解决?_vscode中显示中文乱码_Dontla的博客-CSDN博客