![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
各位观众全体起立
这个作者很懒,什么都没留下…
展开
-
Pandas 教程(下)综合练习
Pandas 教程(下)综合练习一、端午节的淘宝粽子交易二、墨尔本每日最低温度三、2016 年 8 月上海市摩拜单车骑行记录一、端午节的淘宝粽子交易(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。df_1 = pd.read_csv('../data/端午粽子数据.csv')df_1.head()# 结果可以看出有很多脏数据df_1.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 4403原创 2020-07-01 17:08:00 · 387 阅读 · 0 评论 -
Task9 时序数据
Task9 时序数据问题练习问题【问题一】 如何对date_range进行批量加帧操作或对某一时间段加大时间戳密度?pd.date_range().append()【问题二】 如何批量增加TimeStamp的精度?【问题三】 对于超出处理时间的时间点,是否真的完全没有处理方法?【问题四】 给定一组非连续的日期,怎么快速找出位于其最大日期和最小日期之间,且没有出现在该组日期中的日期?练习【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:(a)销售额出现最大值的是星期原创 2020-06-28 23:32:30 · 166 阅读 · 0 评论 -
Task8 分类数据
Task8 分类数据问题练习问题【问题一】 如何使用union_categoricals方法?它的作用是什么?使用union_categoricals需要保证两个categories必须是相同的dtype。作用是把两个union_categoricals连接在一起【问题二】 利用concat方法将两个序列纵向拼接,它的结果一定是分类变量吗?什么情况下不是?不一定s = pd.Series(["a", "d", "c", "a"]).astype('category')s1 = pd.S原创 2020-06-27 15:12:17 · 189 阅读 · 0 评论 -
Task7 文本数据
Task7 文本数据1.问题2. 练习1.问题【问题一】 str对象方法和df/Series对象方法有什么区别?str对象方法主要是针对类型为string的对象【问题二】 给出一列string类型,如何判断单元格是否是数值型数据?使用str.isnumetric()方法【问题三】 rsplit方法的作用是什么?它在什么场合下适用?rsplit() 方法通过指定分隔符对字符串进行分割并返回一个列表,默认分隔符为所有空字符,包括空格、换行(\n)、制表符(\t)等。类似于 split()原创 2020-06-26 16:59:27 · 239 阅读 · 0 评论 -
Pandas Task6 缺失数据
Pandas Task6 缺失数据1. 问题2. 练习1. 问题【问题一】 如何删除缺失值占比超过25%的列?# 构建一个DataFramedf = pd.DataFrame({'a':[1, 2, 3, 4], 'b':[5, 6, np.nan, 8], 'c':[9, np.nan, np.nan, 10], 'd':[11, np.nan, np.nan, np.nan]})# 其中df为输入的DataFrame, n为百分比def drop_nan(df, n): list_d原创 2020-06-23 21:13:36 · 171 阅读 · 0 评论 -
Pandas Task6 综合测试
Pandas Task6 综合测试一、2002 年-2018 年上海机动车拍照拍卖二、2007 年-2019 年俄罗斯机场货运航班运载量三、新冠肺炎在美国的传播一、2002 年-2018 年上海机动车拍照拍卖问题(1) 哪一次拍卖的中标率首次小于 5%?load_path = '../data/'df_car = pd.read_csv(load_path+'2002年-2018年上海机...原创 2020-05-01 23:28:59 · 232 阅读 · 0 评论 -
Pandas Task5 合并
Pandas Task5 合并五、问题与练习问题【问题一】 请思考什么是append/assign/combine/update/concat/merge/join各自最适合使用的场景,并举出相应的例子。append:主要用于添加行assign:主要用于添加列cobmine和update都是用于表的填充函数,可以根据某种规则填充¶concat:主要用于两个DataFrame的行...原创 2020-04-30 23:24:30 · 256 阅读 · 0 评论 -
Pandas Task4 变形
Pandas Task4 变形1. 问题【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。pivot函数是透视表,不过局限性比较大,除了功能上较少之外,还不允许values中出现重复的行列索引对;pivot_table是pivot函数的引申,允许出现行索引的重复,默认为求均值...原创 2020-04-27 21:24:17 · 371 阅读 · 0 评论 -
Pandas Task3 分组
Pandas Task3 分组1.问题【问题一】 什么是fillna的前向/后向填充,如何实现?【问题二】 下面的代码实现了什么功能?请仿照设计一个它的groupby版本。【问题三】 如何计算组内0.25分位数与0.75分位数?要求显示在同一张表上。【问题四】 既然索引已经能够选出某些符合条件的子集,那么filter函数的设计有什么意义?【问题五】 整合、变换、过滤三者在输入输出和功能上有何异同?...原创 2020-04-25 12:42:42 · 546 阅读 · 0 评论 -
Pandas Task2
Pandas Taksk2 索引1.问题【问题一】 如何更改列或行的顺序?如何交换奇偶行(列)的顺序?¶【问题二】 如果要选出DataFrame的某个子集,请给出尽可能多的方法实现。【问题三】 query函数比其他索引方法的速度更慢吗?在什么场合使用什么索引最高效?¶【问题四】 单级索引能使用Slice对象吗?能的话怎么使用,请给出一个例子。【问题五】 如何快速找出某一列的缺失值所在索引?【问题六...原创 2020-04-23 17:10:59 · 358 阅读 · 0 评论 -
Pandas Task1
Pandas Task1问题【问题一】 Series和DataFrame有哪些常见属性和方法?SeiresDataFrame【问题二】 value_counts会统计缺失值吗?【问题三】 与idxmax和nlargest功能相反的是哪两组函数?【问题四】 在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。【问题五】 df.mean(ax...原创 2020-04-19 22:43:53 · 403 阅读 · 0 评论