pandas是一个高效的数据分析工具。基于其高度抽象的数据结构DataFrame,然后我们可以通过操作DataFrame进行数据分析,数据预处理以及行和列的操作等。而读取csv文件要做的工作就是把存储在csv格式中的数据读入并转换成DataFrame格式。
1、pandas提供read_csv方法来读取csv文件
应注意参数encoding,如果编码不对或者不写会报错:UnicodeDecodeError
2、报错内容:OSError: Initializing from file failed
这个报错一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有汉字。第一种情况的话比较简单,需要指定文件名称的完整路径。第二种情况比如:
文件名有汉字就会报错,因为调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为Python就可以解决问题了。
还有一种解决方法就是先用open()函数打开,再访问数据: