本次总结来源于pandas的官网,由个人学习总结出来。
来说下pandas用于读取的文件格式有那些吧,这些读取方法获取文件的速度超级快,很实用。
1、pd.read_csv() 、df.to_csv()
读csv和存储为csv格式的文件,这是日常工作和学习中很常见的。不过,它需要设置的参数很多,需要注意下。
2、pd.read_json()、df.to_json()
读取、存储json格式的,在网页中常常使用这种格式来作为存储方式
3、pd.read_html()、df.to_html()
读取网页中的表格
4、pd.read_excel() : 2003 , xlrd: 2007+
pd.to_excel() : 保存为DataFrame后保存
xlsx = pd.ExcelFile(‘path_to_file.xls’)
df = pd.read_excel(xlsx, ‘Sheet1’)
或者
using the ExcelFile class
data = {}