数据分析第四课:pandas统计分析基础

读写不同数据源的数据

1、数据库数据读取


在这里插入图片描述
在这里插入图片描述

2、文本文件储存

在这里插入图片描述

读写Excel文件

在这里插入图片描述

掌握DataFrame的常用操作

查看DataFrame的常用属性

基础属性

在这里插入图片描述

查改增删dataframe数据

1、查看访问DataFrame数据——基本查看方式

在这里插入图片描述

data['dishes_name']
data.dishes_name#不建议使用,易与属性方法混淆

在这里插入图片描述
在这里插入图片描述
dataframe具有行名称和列名称,所以除了用名称索引之外,还可以用行列号索引。

data.iloc[2,2]
data.loc[2,'dishes_id']

loc前后均闭的区间,iloc前闭后开区间
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
也可以用delete

del data2['detail_id']

描述分析DataFrame数据

1、数值型

在这里插入图片描述

data2.mean()#部分字符型数据不进行计算,只对数值型计算

2、类别型 在这里插入图片描述

在这里插入图片描述

转换与处理时间序列

pandas事件相关的类

在这里插入图片描述
在这里插入图片描述

data['lock_time']=pd.to_datetime(data['lock_time'])#赋值才会对原值有改变

timestamp是有时间范围限制的,不能超过这个时间范围
在这里插入图片描述
在这里插入图片描述

提取时间序列数据信息

Timestamp类常用属性

在这里插入图片描述

加减时间数据

Timedelta类

在这里插入图片描述
在这里插入图片描述

使用分组聚合进行组内计算

聚合:依照一个或几个字段对数据分组,并且对每个分组应用一个函数,pandas提供groupby方法进行分组

使用groupby方法拆分数据

在这里插入图片描述

groupby方法的参数及其说明

在这里插入图片描述

GroupBy对象常用的描述性统计方法

在这里插入图片描述

使用agg方法聚合数据

agg和aggregate函数参数机器说明

在这里插入图片描述

agg方法求统计

在这里插入图片描述

data_gb.agg(np.sum)#可灵活应用函数
data_gb.sum()#只提供部分功能

在这里插入图片描述

agg方法与自定义函数

apply

在这里插入图片描述

#结果一样,但是apply无法针对字段进行单独的聚合
data[['counts','amounts']].apply(np.sum)
data[['counts','amounts']].agg(np.sum)

在这里插入图片描述

使用transform方法聚合数据

在这里插入图片描述

创建透视表与交叉表

透视表是数据分析常用工具之一,根据一个或多个键进行聚合

使用povit_table函数创建透视表

pivot_table函数常用参数及说明

在这里插入图片描述

pivot_table函数主要的参数调节

在这里插入图片描述

crosstab创建交叉表

在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值