学习笔记——Pandas（一）

最新推荐文章于 2021-01-28 17:56:06 发布

啾比特

最新推荐文章于 2021-01-28 17:56:06 发布

阅读量206

点赞数

本文链接：https://blog.csdn.net/qq_46258819/article/details/105889968

版权

♤Series类型

Series类型是由一组数据及与之相关的数据索引组成，每个数据都必须有索引

✦Series的创建
1、从标量创建Series类型
在这里插入图片描述
index表达了 Series的尺寸，不能省略
2、从字典创建

index从字典里面进行选择操作，由于字典中没有对应的d的值，因此d=NaN,且NaN的数据类型是float
3、从ndarray类型创建

4、从Python列表中创建，index与列表元素个数一致
在这里插入图片描述
5、其他函数如range等

✦基本操作
1、.index 获得索引，数据类型为index；.values获得数据，数据类型为array
在这里插入图片描述
2、Series中自动索引和自定义索引并存，但不能混用
3、Series类型是索引+值的类型，进行切片，运算时返回的还是Series类型，而对于单个元素返回的是对应的数据类型

4、in 不会判断自动索引，只能判断自定义索引
在这里插入图片描述 5、.get(‘f’,100)从Series中寻找索引为f的值，若索引不在则返回100

6、Series类型的对齐操作
Series类型在运算中会自动对于其不同索引的数据

♤DataFrame

由共用相同索引的一组列组成，每列值的类型可以相同也可以不同，即索引+多列数据
✦创建
1、从二维ndarray对象创建
在这里插入图片描述
2、从一维ndarray对象字典创建
数据会根据行列索引自动对齐
3、从列表类型的字典创建

✦重新索引

.reindex()能够改变或重排Series和DataFrame的索引
参数说明：
索引类型的常用方法
.append(index) 连接另一个ubdex对象，产生新的index
.diff(index) 计算差集，产生新的index对象
.intersection(index) 交集
.union(index) 并集
.delete(loc) 删除loc位置处的元素
.insert(loc,e) 在loc位置处增加一个元素e

✦数据类型运算
1、法则：
①根据行列索引，补齐后运算，默认产生浮点数，相同才运算
②补齐时缺项填充NaN
③二维和一维，一维和零维间为广播运算（低维作用到高维的每一项）
④±*/符号进行二元运算时产生新的对象
2、fill_value参数可以替代NaN参与运算，但只适用于.add等此类方法型操作
3、比较运算的法则：
①只能比较相同索引的元素，不进行补齐操作
②二维和一维，一维和零维间为广播运算，默认在1轴
③采用比较符号进行二元运算，产生布尔对象
④同维度要求尺寸一致，不一致会报错
在这里插入图片描述