- 为什么有人做numpy、pandas的库?方便大量数据时操作
- pandas有三种数据结构:series类似于一维数组,dataframe类似于二维数组,panel可以视为excel的sheet
- dataframe选取列:df.select_
- dataframe选取行:(利用切片) 前两行:df[:2] 前5行:head() 前n行:head(n) 尾5行:tail() 抽取样例:sample()
- loc与iloc
- query查询数据
- 布尔选择方式查找 df[df['year']==2001]
增加数据
- 增加行:append函数
- 增加列:insert函数
删除数据
- drop
修改数据
- replace
- rename
其他
- lamda
- applymap
- map
排序
- sort_index
- sort_values