Pandas数据分析 ——Task03:分组

这篇博客介绍了Pandas中分组分析的应用,包括fillna的前向/后向填充方法,分组计算统计量如分位数,以及filter、transform和aggregate的区别。同时,提出了钻石价格分析和美国非法药物报告数量的实践问题,涉及统计、分组和线性回归等操作。
摘要由CSDN通过智能技术生成

教程地址:joyful-pandas/第3章 分组——datawhalechina
……这两天太忙,知识点等有空后再回来整理

Pandas分组

五、问题与练习

问题
【问题一】 什么是fillna的前向/后向填充,如何实现?
答:fillna 的method方法可以控制参数的填充方式
backfill / bfill: 前向填充
pad / ffill: 后向填充
实现方式如下:

df_nan.Math=df_nan.Math.fillna(method='pad')

【问题二】 下面的代码实现了什么功能?请仿照设计一个它的groupby版本。

s = pd.Series ([0, 1, 1, 0, 1, 1, 1, 0])
s1 = s.cumsum()
result = s.mul(s1).diff().where(lambda x: x < 0).ffill().add(s1,fill_value =0)

答:
s1:将s序列求累加和
s.mul(s1): s 与s1累乘
diff() :求一阶差分
where(lambda x: x < 0) :判断值是否小于0
fill():向下填充
add(s1,fill_value =0) :缺失值补0后与s1求和

【问题三】 如何计算组内0.25分位数与0.75分位数?要求显示在同一张表上。
答:

gp.apply(lambda x:pd.DataFrame({
   'q25':x.quantile(0.25),
                                'q75':x.quantile(0.75)}))

【问题四】 既然索引已经能够选出某些符合条件的子集,那么filter函数的设计有什么意义?
答:filter函数是用来筛选组的(结果是组的全体)
【问题五】 整合、变换、过滤三者在输入输出和功能上有何异同?
答:
整合:分组计算统计量,输入的是每组数据,输

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pandas是一个开源的Python数据分析库,提供了多种数据结构,其中包括DataFrame和Panel。DataFrame是pandas中最常用的数据结构之一,它是一个二维的数据结构,数据以行和列的表格方式排列,可以执行各种行列操作和算术运算。通过pandas的DataFrame构造函数,我们可以创建一个DataFrame对象,传入数据、索引、列名等参数来构建DataFrame对象。 另外,pandas还提供了Panel这个数据结构,它是一个三维的数据结构,可以看作是DataFrame的容器,可以存储多个DataFrame。通过pandas的Panel构造函数,我们可以创建一个空的Panel对象,也可以传入数据、items、major_axis、minor_axis等参数来构建一个具有数据的Panel对象。 对于DataFrame,我们可以指定索引和列名来创建一个具有特定结构的DataFrame。在创建DataFrame时,如果给定的索引和列名的长度与数据的维度不匹配,将会报错。例如,在给定的数据列表中,如果每个内层列表的长度与列名的长度不一致,将会报错。 综上所述,pandas提供了多种数据结构,包括DataFrame和Panel,它们可以用于对数据进行分析和操作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Pandas数据结构分析](https://blog.csdn.net/m0_58387972/article/details/123302776)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Python3快速入门(十三)——Pandas数据结构](https://blog.csdn.net/cdqvkn73338/article/details/100959261)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值