python模块panda介绍
panda是一个数据分析和处理的python库,使用时需要依赖numpy库,因此要import numpy
功能介绍
IO工具:进行文件的读写操作
索引和数据选择器:类似于Excel中的筛选功能
多索引/高级索引
合并,连接,比较
重塑和数据透视:对表格的重新编排
处理文本字符串
处理丢失数据
分类数据
时间日期的处理
计算工具:如计算数据方差等
数据可视化:画图
等等(不详细列举)
panda中的数据结构
数据的对齐是内在的
两种主要的数据结构:Serial和DataFrame
Series:是一维的带标签的数组,标签相当于索引,可以通过标签来查找对应的数据。如果没有自己传入标签值,panda会自动添加0,1,2…的整数标签
例如:
DataFrame:是一个带有可能不同类型列的二维的电子表格,有行标签和列标签作为索引
例如:
通过标签索引进行数据的筛选: