补充:
Series自动对齐
当多个series对象之间进行运算的时候,如果不同series之间具有不同的索引值,那么运算会自动对齐不同索引值的数据,如果某个series没有某个索引值,那么最终结果会赋值为NaN。
示例:
DataFrame对象的使用
1、DataFrame的创建
通过二维数组创建
通过字典创建
注意:不能将columns直接写道DataFrame()里面,否则会出现
2、索引对象
不管是Series还是DataFrame对象,都有索引对象。
索引对象负责管理轴标签和其它元数据(eg:轴名称等等)
通过索引可以从Series、DataFrame中获取值或者对某个索引值进行重新赋值
Series或者DataFrame的自动对齐功能是通过索引实现的
3、DataFrame数据获取
可以直接通过列索引获取指定列的数据, eg: df[column_name]
如果需要获取指定行的数据的话,需要通过ix方法来获取对应行索引的行数据,eg: df.ix[index_name]
4、通过行索引和列索引对数据进行修改或者铁添加
5、pandas基本功能
数据文件读取/文本数据读取、 索引、选取和数据过滤、算法运算和数据对齐、函数的应用和映射、重置索引
6、pandas数据文件读取
通过pandas提供的read_xxx相关的函数可以读取文件中的数据,并形成DataFrame,常用的数据读取方法为:read_csv,主要可以读取文本类型的数据
读取csv文件
读取txt文件
读取excel文件
7、pandas:数据过滤获取
通过DataFrame的相关方式可以获取对应的列或者数据形成一个新的DataFrame, 方便后续进行统计计算。
通过切片进行数据检索及删除有NaN的行
8、pandas缺省值NaN处理方法
对于DataFrame/Series中的NaN一般采取的方式为删除对应的列/行或者填充一个默认值
对NaN的表格进行填充,以0进行填充
对NaN表格的数据进行填充,以列进行填充。
删除有NaN的行
删除全为NaN的行how =all
删除有NaN的列axis=1