pandas
风灵无畏YY
本蒟蒻为在校大学生,不定期更新一些有关计算机相关知识的学习记录,有不恰当的地方还请指出。
展开
-
datawhale——pandas组队学习——综合练习
说实话,我真的一题都不会做,一切都感觉那么的似曾相识,但就是不会做,不是这里有问题就是那里有问题,我放弃了。没有Python基础的我,只能等待大佬们的答案吧。本来以为可以做完这个第一大题的,但是现在看来,我以及尽力了,尝试了好久都没弄出来,先写个记录吧,我真的太菜了。qwq题目第一题尝试的解答并没有做出来什么实质性的东西。...原创 2020-07-01 16:52:47 · 172 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——时序数据
学习资源链接时序数据一、总览时序相关二、疑问1.2.3.三、思考题【问题一】 如何对date_range进行批量加帧操作或对某一时间段加大时间戳密度?【问题二】 如何批量增加TimeStamp的精度?【问题三】 对于超出处理时间的时间点,是否真的完全没有处理方法?【问题四】 给定一组非连续的日期,怎么快速找出位于其最大日期和最小日期之间,且没有出现在该组日期中的日期?四、练习题【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:(a)销售额出现最大值的是星原创 2020-06-29 19:32:36 · 172 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——分类数据
学习资源链接分类数据一、总览二、疑问1.不懂下面的这个是怎么创建出来的,创建出来之后是用来干什么的。2.在这里为什么更改类型之后里面的元素值是改变了的,并且为什么只改变了这里面abca中的aba,没有改变那个c。解答:因为他在这里更改了类型,但是c的类型还是没有变,所以前面的那个c就不会变成nan,其他的就会变成nan,因为原先的类型变了。3.这里前面的abca是指元素值,后面的那个abcd是指元素类型吗?并且后面的那个abcd可不可以写成efgh之类的,只是一个类型的名称而已?对于上面的解原创 2020-06-27 16:46:59 · 280 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——文本数据
学习资源链接:pandas文本数据一、总览二、正则表达式三、思考题【问题一】 str对象方法和df/Series对象方法有什么区别?【问题二】 给出一列string类型,如何判断单元格是否是数值型数据?【问题三】 rsplit方法的作用是什么?它在什么场合下适用?【问题四】 在本章的第二到第四节分别介绍了字符串类型的5类操作,请思考它们各自应用于什么场景?四、练习题【练习一】 现有一份关于字符串的数据集,请解决以下问题:(a)现对字符串编码存储人员信息(在编号后添加ID列),使用如下格原创 2020-06-26 20:44:41 · 200 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——缺失数据
学习资源链接:pandas缺失数据一、总览二、疑问1.NaT是对时序版本的缺失值2.3.三、思考题【问题一】 如何删除缺失值占比超过25%的列?这个倒是不知道【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?这是Pandas在1.0新版本中引入的重大改变,其目的就是为了(在若干版本后)解决之前出现的混乱局面,统一缺失值处理方法【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?四、练习题【练习一】现有一份虚拟数据集,列类型分别为strin原创 2020-06-22 10:14:57 · 244 阅读 · 0 评论