Pandas模块是一个强大的数据分析和处理模块,能为复杂情形下的数据提供坚实的基础分析功能。
所谓的复杂情形,可能有以下三种:
①数据库表或Excel表,包含了多列不同数据类型的数据(如数字、文字)
②时间序列类型的数据,包括有序和无序的情形,甚至是频率不固定的情形
③任意的矩阵型、二维表、观测统计数据,允许独立的行或列带有标签
下面介绍Pandas模块中的基本的高级数据结构,以及Pandas模块中经典的数据分析和处理方法
一。pandas中的高级数据结构
- 序列(Series)
- 数据框(DataFrame)
有了它们,可以利用pandas在计算机内存中构建一个虚拟的数据库。
1. 数据框
age | cash | id | |
0 | 18 | 10.53 | Jack |
1 | 35 | 500.70 | Sarah |
2 | 20 | 13.60 |