一、Pandas库基础知识
1. Pandas关注数据的索引调用
1. Series类型
1.1 Series类型主要由数据和数据索引组成
1.2 Series创建
可用于创建Series |
---|
Python列表 |
标量值 |
Python字典 |
ndarray |
其他函数 |
1.3 Series类型的基本操作
(1) Series索引
1.1 Series其他索引形式
(2) Series搜索内部值的函数/font>
(3) Series 类型四则运算的对其操作
(4) Series 内部元素的修改
2. Dataframe类型
2.1 Dataframe的创建
(1) 从二维ndarray对象创建
(2) 从一维ndarray对象创建
(3) 从列表类型的字典创建
2.2 Dataframe的索引
2. 数据类型操作
操作 | 函数 |
---|---|
增加或重排 | .reindex()可改变或重排索引 |
删除 | drop() |
2.1 增加或者重排.reindex(index=None, columns=None,...)
参数 | 说明 |
---|---|
index, columns | 新的行列自定义索引 |
fill_value | 重新索引中,填充缺失位置的值 |
method | 填充方法,ffill当前值向前填充,bfill向后填充 |
limit | 最大填充量 |
新增一列的索引
2.2 索引类型的常用方法:先定义一个操作类型,然后传入.reindex()函数中
2.3 删除指定索引对象
二、 Pandas的数据运算
2.1 数据类型的算数运算
1. 直接操作形式的四则运算
2. 函数形式的四则运算
3. 不同维度为广播运算,一维Series默认在轴1参与运算
4. 比较运算法则
三、数据特征分析
3.1 数据的分析
1. 排序,可选择排序方式以及指定轴和某个索引,NaN 统一放在末尾排序
2. 基本统计分析函数
3. 可一次得出所有属性的函数
4. 累计统计分析函数