Python数据分析(三):Pandas
一、Pandas库的介绍
Pandas是Python的第三方库,提供高性能易用数据类型和分析工具。
import pandas as pd
Pandas基于Numpy实现,常与Numpy和Matplotlib一同使用。
两个数据类型:Series、DataFrame
Numpy | Pandas |
---|---|
基础数据类型 | 扩展数据类型 |
关注数据的结构表达 | 关注数据的应用表达 |
维度:数据间关系 | 数据与索引间关系 |
二、Pandas库的Series类型
Serise类型由一组数据及与之相关的数据索引组成。
Series类型可以由如下类型创建:
- Python列表,index与列表元素个数一致。
- 标量值,index表达Series类型尺寸。
- Python字典,键值对中的“键”是索引,index从字典中进行选择操作。
- ndarray,索引和数据都可以通过ndarray类型创建。
- 其他函数,range()函数等。
1、Series类型的基本操作
- Series类型包括index和values两部分
- Series类型的操作类似ndarray类型
①索引方法相同,采用[ ]
②NumPy中运算和操作可以用于Series类型