pandas数据结构
1、引言
➢Pandas 是基于NumPy的一-种工具,该工具是为了解决数据分析任务而创建的。
➢Pandas纳入了大量库和一-些标准的数据模型,提供了高效地操作大型数据集所需的工具。
➢Pandas 提供了大量能使我们快速便捷地处理数据的函数和方法。
➢Pandas是Python的一-个数据分析包,最初于2008年4月开发,2009年底开源,目前由PyData开发团队继续开发和维护。
➢Pandas最初被作为金融数据分析I具而开发出来,也为时间序列分析提供了很好的支持。
2、pandas库介绍
◆pandas是python第三方库,提供高性能易用数据类型和分析工具
◆pandas基于numpy实现,常与numpy和matplotlib一同使用
◆pandas中有两大核心数据结构: Series(-维数据)和DataFrame (多特征数据,既有行索引,又有列索引)
3、pandas库介绍
◆Series:
➢–维数组,与Numpy中的一-维array类似。
➢Series、 numpy中的一维array与 Python基本的数据结构List 也很相近,其区别是: List 中的元素可以是不同的数据类型,而array和Series中则只允许存储相同的数据类型。
➢Series可以更有效的使用内存 ,提高运算效率。
◆Time- Series:以时间为索引|的Series。
◆DataFrame :带标签且大小可变的二维表格型数据结构,可以将DataFrame理解为Series的容器。
◆Panel :三维的数组,可以理解为DataFrame的容器。
Series
◆Series是一-种类似于一维数组的对象,它由一维数组(各种numpy数
pandas数据结构知识点
最新推荐文章于 2022-07-15 19:50:01 发布