rood-Python 3读取.CSV文件遇到的编码问题

最新推荐文章于 2024-06-20 16:57:42 发布

工紫新波

最新推荐文章于 2024-06-20 16:57:42 发布

阅读量1.5k

点赞数 1

分类专栏： Python 文章标签： Python3

本文链接：https://blog.csdn.net/qq_30589271/article/details/79028957

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

今天算是我第一次进行Python 静心的学习过程了。
拿到隧道的数据拷贝一下我擦30多G 很是happy 看来可以在故障检测上面的有点进展了。
进入正题：
首先想要读取.CSV 文件，看到pandas模块有直接读取的操作read_csv（）函数。虽然印象中Python中好像内置有open（），read（）等等函数，但是呃呃我是渣渣实在记不得怎么用。。。。。。
于是很开心的给了一句
pd.read_csv(‘D:/AAProject/data/west/1/2012101100_2012101123.csv’)
悲剧了。。。。报错
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb1 in position 0: invalid start byte
赶紧找度娘。。
度娘说。。啊这种情况吧你要。。。
【
import sys
import imp
imp.reload(sys)
sys.setdefaultencoding(‘utf-8’)
】—说是改变Python解释器的编码方式，默认是Unicode 要该为 utf-8
然并卵啊，AttributeError: module ‘sys’ has no attribute ‘setdefaultencoding’
就是告诉我sys里面没有这个方法呗。要是想当年出现这种情况，，，我直接做系统了。。。。
淡定。重新百度。。。。
因为我的源文件数据里确实有汉字所以很可能‘GBK’编码呗。那就看看pandas 的read_csv()函数里面有没有规定编码方式的参数控制呗，重要发现还是有参数进行控制的，小菜在这里给出语句
pd.read_csv(‘D:/AAProject/data/west/1/2012101100_2012101123.csv’,encoding=”gbk”,skiprows=[1])
至此问题完美解决。