python数据分析(三)-----pandas

Pandas是Python第三方库,提供高性能易用数据类型和分析工具
Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用
import pandas as pd

Pandas库与numpy库相似,但它更注重扩展数据类型,关注数据的应用表达,数据与索引间的关系

Pandas库Series类型

Series类型由一组数据及与之相关的数据索引组成
如:index_0 ---------> data_a
index_1 ---------> data_b
索引 数据
在这里插入图片描述
作为第二个参数,可以省略index=

** 从标量值创建**
在这里插入图片描述
从字典类型创建
在这里插入图片描述
在这里插入图片描述
从ndarray类型创建
在这里插入图片描述
在这里插入图片描述

Series类型的基本操作

.index 获得索引
.values 获得数据
Series类型的操作类似ndarray类型:
• 索引方法相同,采用[]
• NumPy中运算和操作可用于Series类型
• 可以通过自定义索引的列表进行切片
• 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

Series类型的操作类似Python字典类型:
• 通过自定义索引访问
• 保留字in操作
• 使用.get()方法
在这里插入图片描述
Series对象和索引都可以有一个名字,存储在属性.name中

Pandas库的DataFrame类型

DataFrame是一个表格型的数据类型,每列值类型可以不同
DataFrame既有行索引、也有列索引
DataFrame常用于表达二维数据,但可以表达多维数据
在这里插入图片描述
从二维ndarray对象创建
在这里插入图片描述
从一维ndarray对象字典创建
在这里插入图片描述
从列表类型的字典创建
在这里插入图片描述
数据根据行列索引自动补齐

Pandas库的数据类型操作

重新索引
.reindex()能够改变或重排Series和DataFrame索引
.reindex(index=None, columns=None, …)的参数
在这里插入图片描述
索引类型的常用方法
在这里插入图片描述
删除指定索引对象
.drop()能够删除Series和DataFrame指定行或列索引

算术运算

算术运算根据行列索引,补齐后运算,运算默认产生浮点数
补齐时缺项填充NaN (空值)
二维和一维、一维和零维间为广播运算
采用+ ‐ * /符号进行的二元运算产生新的对象

在这里插入图片描述
在这里插入图片描述

数据的排序

.sort_index()方法在指定轴上根据索引进行排序,默认升序
.sort_index(axis=0, ascending=True)
在这里插入图片描述
.sort_values()方法在指定轴上根据数值进行排序,默认升序
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)
by : axis轴上的某个索引或索引列表
在这里插入图片描述
在这里插入图片描述
NaN统一放到排序末尾

基本统计分析函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

数据的累计统计分析

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值