pandas来自于panel data,后面就用熊猫代替pandas了!
numpy和熊猫相比较,还是有很多不足的地方。熊猫强大的原因如下:
-
一个强大的分析和操作大型结构化数据集所需的工具集
-
基础是NumPy,提供了高性能矩阵的运算
-
提供了大量能够快速便捷地处理数据的函数和方法
-
应用于数据挖掘,数据分析
-
提供数据清洗功能
一、读取文件
熊猫读取每一种不同的文件有不同的方法比如:
读csv文件:pandas.read_csv( )
读excel文件:pandas.read_excel( )
读json 文件:pandas.read_json ( )
其实这么看起来也很好记忆的!
1.csv
pandas.read_csv( filepath_or_buffer, sep =',' , usecols=[] )
filepath_or_buffer:文件路径
sep =',' :分隔符,一般用逗号
usecols=[]:选择读取的列,必须用列表形式
file.to_csv( filepath_or_buffer, sep =',' , columns=[] )
columns=['open', 'high', 'close'], # 指定保存数