♤Series类型
Series类型是由一组数据及与之相关的数据索引组成,每个数据都必须有索引
✦Series的创建
1、从标量创建Series类型
index表达了 Series的尺寸,不能省略
2、从字典创建
index从字典里面进行选择操作,由于字典中没有对应的d的值,因此d=NaN,且NaN的数据类型是float
3、从ndarray类型创建
4、从Python列表中创建,index与列表元素个数一致
5、其他函数 如range等
✦基本操作
1、.index 获得索引,数据类型为index;.values获得数据,数据类型为array
2、Series中自动索引和自定义索引并存,但不能混用
3、Series类型是索引+值的类型,进行切片,运算时返回的还是Series类型,而对于单个元素返回的是对应的数据类型
4、in 不会判断自动索引,只能判断自定义索引
5、.get(‘f’,100)从Series中寻找索引为f的值,若索引不在则返回100
6、Series类型的对齐操作
Series类型在运算中会自动对于其不同索引的数据
♤DataFrame
由共用相同索引的一组列组成,每列值的类型可以相同也可以不同,即索引+多列数据
✦创建
1、从二维ndarray对象创建
2、从一维ndarray对象字典创建
数据会根据行列索引自动对齐
3、从列表类型的字典创建
✦重新索引
- .reindex()能够改变或重排Series和DataFrame的索引
参数说明:
- 索引类型的常用方法
.append(index) 连接另一个ubdex对象,产生新的index
.diff(index) 计算差集,产生新的index对象
.intersection(index) 交集
.union(index) 并集
.delete(loc) 删除loc位置处的元素
.insert(loc,e) 在loc位置处增加一个元素e
✦数据类型运算
1、法则:
①根据行列索引,补齐后运算,默认产生浮点数,相同才运算
②补齐时缺项填充NaN
③二维和一维,一维和零维间为广播运算(低维作用到高维的每一项)
④±*/符号进行二元运算时产生新的对象
2、fill_value参数可以替代NaN参与运算,但只适用于.add等此类方法型操作
3、比较运算的法则:
①只能比较相同索引的元素,不进行补齐操作
②二维和一维,一维和零维间为广播运算,默认在1轴
③采用比较符号进行二元运算,产生布尔对象
④同维度要求尺寸一致,不一致会报错