Python常用包学习（二）Pandas包（理论+动手实践）

最新推荐文章于 2024-05-27 15:04:33 发布

路易三十六

最新推荐文章于 2024-05-27 15:04:33 发布

阅读量1k

点赞数 1

分类专栏： Python PYTHON常用包文章标签： Python常用包学习（二）Pandas包 DataFrame Series

本文链接：https://blog.csdn.net/LuYi_WeiLin/article/details/100020746

版权

pandas是一种Python数据分析的利器，是一个开源的数据分析包，最初是应用于金融数据分析工具而开发出来的，因此pandas为时间序列分析提供了很好的支持。pandas是PyData项目的一部分。

pandas中主要有两种数据结构，分别是：Series和DataFrame。

Series：一种类似于一维数组的对象，是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。注意：Series中的索引值是可以重复的。

通过一维数组创建

通过字典的方式创建

Series值的获取主要有两种方式：

NumPy中的数组运算，在Series中都保留了，均可以使用，并且Series进行数组运算的时候，索引与值之间的映射关系不会发生改变。

注意：其实在操作Series的时候，基本上可以把Series看成NumPy中的ndarray数组来进行操作。ndarray数组的绝大多数操作都可以应用到Series上。（ndarray相关操作可参考我的第一篇博客）

pandas中的isnull和notnull两个函数可以用于在Series中检测缺失值，这两个函数的返回时一个布尔类型的Series

当多个series对象之间进行运算的时候，如果不同series之间具有不同的索引值，那么运算会自动对齐不同索引值的数据，如果某个series没有某个索引值，那么最终结果会赋值为NaN

Series对象本身以及索引都具有一个name属性，默认为空，根据需要可以进行赋值操作

关注