python数据处理简介
在python中数据处理的库为:pandas,
数据读取的类名为read_xxx, 最常用的是read_excel,read_csv
代码示例:
import pandas as pd
df = pd.read_csv(filename)
在使用的时候,需要注意以下几个常用参数的使用:
- dtype指定读入数据的数据类型为“str”,可以防止像身份证之类的数据读入之后,变成科学计数法。
- encoding指定读入数据的时候使用哪种编码方式,要和原文件的编码方式一致。默认为UTF-8。
- sheetname用于当文件中有多个sheet的时候指定sheet的名称。