Pandas系列目录
- Pandas系列(一):数据结构(Series、DataFrame和时间序列)
- Pandas系列(二):IO和常用工具
- Pandas系列(三):数据清洗
- Pandas系列(四):数据处理
- Pandas系列(五):可视化绘图
Pandas(Panel Data)是基于NumPy的数据分析库。它包含许多库和一些标准的数据模型,提供了高效地操作大型数据集所需的方法,并且提供了大量能使我们快速便捷地处理数据的内置函数。
Pandas可以从各种文件格式比如 CSV、JSON、SQL导入数据。可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。被广泛应用在学术、金融、统计学等各个数据分析领域。
Pandas的核心为两种数据结构和操作:
- Series:带索引的一维数组,与Numpy中的一维array类似。
- DataFrame:带索引的二维数据(的表格形)结构。
老版本有Panel(三维的数组,DataFrame的容器)数据结构,新版本已经废除。
Pandas功能思维导图
个人总结,部分内容进行了简单的处理和归纳,如有谬误,希望大家指出,持续修订更新中。
修订历史版本见:https://github.com/hustlei/AI_Learning_MindMap
未经允许请勿转载。