一、关于Pandas
【简介】: pandas是建立在Numpy基础上的高效数据分析处理库,是Python的重要数据分析库。pandas提供了众多的高级函数,极大地简化了数据处理的流程,尤其是被广泛地应用于金融领域的数据分析。
pandas
二、Pandas特点
pandas主要特点主要有以下几个方面,力图营造一个Pandas共呢能十分强大的印象:
带有标签的数据结构,Pandas库主要围绕Series类型(一维)和DataFrame类型(二维)这两种数据结构。
允许简单索引和多级索引;
轻松处理浮点数据中的丢失数据(以NaN表示)以及非浮点数据;
功能强大,灵活的按组功能来执行对数据集拆分申请,联合行动,对于聚合和转换数据;
可以轻松地将其他Python和NumPy数据结构中的不同索引的数据转换为DataFrame对象;
基于智能标签的切片,花式索引和 大型数据集的子集;
直观的合并和连接数据集;
数据集的灵活的重塑和旋转;
【重点指南】:下面将重点介绍pandas 中的三大数据结构:Series、DATa Frame、Index;
三、Series类型
【介绍】:Series可以运用ndarray或字典的几乎所有索引操作和函数,融合了字典和ndarray的优点。
# 导入包
import numpy as np
import pandas as pd