如果这么联想,说明您英语好!
今天要说的,还是Python数据分析三剑客中,第二剑 —— pandas
pandas是另一个可以提高Python数据科学技能的优秀库。就像NumPy一样,它也属于SciPy开源软件家族。
Python的pandas库,提供了多功能和强大的工具来化解数据结构并执行数据分析。
更厉害的是:pandas可以很好地处理不完整、非结构化和无序的真实世界数据,并提供了用于数据集成形、聚合和分析的工具。
pandas提供了三种数据类型,熟悉线性代数的小伙伴们估计会感觉很亲切熟悉:
- Series: 一维数据列表,类似线性代数中的向量
- DataFrame: 二维数据组,类似线性代数中的矩阵
- Panel: 三维数据组,可以理解成描述某长度x、某宽度y,高度z的若干个点的组合
举几个栗子
首先,加载本文主角pandas,以及我们的老朋友,上次露面的numpy
import pandas as pdimport numpy as np
其次,先示范一个一维数据列表
s1 = pd.Series([1, 3, 5, 7], dtype=int)print(s1)# 结果是:# 0 1# 1 3# 2