Pandas基础学习（下） Task03：分类数据（知识梳理脑图+全部资源教程）

最新推荐文章于 2024-09-18 20:39:31 发布

RexT1

最新推荐文章于 2024-09-18 20:39:31 发布

阅读量319

点赞数

分类专栏： # pandas基础学习文章标签： python 人工智能

本文链接：https://blog.csdn.net/qq_45556599/article/details/106987246

版权

pandas基础学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章目录

Pandas基础学习（下）

Pandas基础学习（下）

之前跟随Pandas（上）学习，收获良多，这次开了下的组队学习，迫不及待的加入了。Datawhale是一个很好的开源组织，会组织很多免费的知识学习。

附上本次组队学习的计划和教程资料，即使没有当时加入组队学习，有兴趣的话从现在开始学习也不晚哦~

现在学习喜欢用脑图的方式，知识点清晰明了，易于查找和复习，希望也可以帮助大家梳理知识脉络。

Pandas基础学习（上）
Pandas基础学习（下）
Task01：缺失数据
 Task02：文本数据
 Task03：分类数据
 Task04：时序数据
 Task05：综合练习

一、Task03：分类数据

在这里插入图片描述
链接：https://pan.baidu.com/s/1J7oD6gnHzRF8xEk6DDpsHg
提取码：xqvt

二、问题与练习

1、问题

【问题一】如何使用union_categoricals方法？它的作用是什么？
在这里插入图片描述
【问题二】利用concat方法将两个序列纵向拼接，它的结果一定是分类变量吗？什么情况下不是？

【问题三】当使用groupby方法或者value_counts方法时，分类变量的统计结果和普通变量有什么区别？

【问题四】下面的代码说明了Series创建分类变量的什么“缺陷”？如何避免？（提示：使用Series中的copy参数）
在这里插入图片描述

2、练习

【练习一】现继续使用第四章中的地震数据集，请解决以下问题：
在这里插入图片描述
（a）现在将深度分为七个等级：[0,5,10,15,20,30,50,np.inf]，请以深度等级Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ,Ⅵ,Ⅶ为索引并按照由浅到深的顺序进行排序。

（b）在（a）的基础上，将烈度分为4个等级：[0,3,4,5,np.inf]，依次对南部地区的深度和烈度等级建立多级索引排序。
在这里插入图片描述

【练习二】对于分类变量而言，调用第4章中的变形函数会出现一个BUG（目前的版本下还未修复）：例如对于crosstab函数，按照官方文档的说法，即使没有出现的变量也会在变形后的汇总结果中出现，但事实上并不是这样，比如下面的例子就缺少了原本应该出现的行’c’和列’f’。基于这一问题，请尝试设计my_crosstab函数，在功能上能够返回正确的结果。
在这里插入图片描述