Pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具
- 对齐功能
- 时间序列功能
- 数学运算和约简可以按照不同的轴执行
- 灵活处理缺失数据
- 关系型运算
一、Series
Series是一种类似于一维数组的对象 ,它由一组数据(任何Numpy类型)以及一组与之相关的数据标签构成。
1. Series的创建
2. Series的索引
示例Series:
obj = Series([4,7,-5,3], index=['a','b','c','d'])
- case1. Series本身索引非整数索引,采用整数索引
- case2. Series本身索引非整数索引,采用自身索引
- case3. Series本身为整数索引
示例Series:
obj2 = Series([4,7,-5,3], index=[1,0,4,6])
3. Series数组运算
- 根据布尔型数组进行过滤、标量乘法、应用数学函数等,都保留索引和值之间的链接
- 在算术运算中,会自动按照索引对齐进行运算
4. 缺失数据NaN
- pandas中的isnull()和notnull()函数可用于检测缺失数据(numpy中为isnan函数)
5. name属性
- Series对象本身及其索引都有一个name属性
- Series的索引可以通过赋值的方式就地修改