首先
import pandas as pd
pandas提供了一些将表格型数据读为DataFrame对象的函数。
(1)读入本地文件为pandas对象
pd.read_csv() #默认分隔符是逗号
pd.read_table() #默认分隔符是\t
pd.read_table(sep=',') #指定分隔符
不需要指定数据类型。
(2)保存pandas对象到本地文件
data.to_csv('data.csv')
(3)json字符串
result=json.loads(obj) #可以将json字符串转换成python形式
obj=json.dumps(result) #将python对象转换为json格式。
(4)二进制数据格式
data.save('data') #以二进制形式存储pandas对象到本地
data=pd.read('data') #读入二进制数据格式到pandas对象
(5)读取excel文件到pandas对象
首先
import xlrd
import openpyxl
xls_file=pd.ExcelFile(‘xxx.xls’)
table=xls_file.parse(‘Sheet1’) #把表格Sheet1保存到DataFrame对象