数据处理
wield_jjz
这个作者很懒,什么都没留下…
展开
-
数据分析之pandas-综合练习1
数据分析之pandas-综合练习1一、2002 年-2018 年上海机动车拍照拍卖import pandas as pdimport numpy as npdf = pd.read_csv('./data/2002年-2018年上海机动车拍照拍卖.csv')df.head()df.info()问题(1) 哪一次拍卖的中标率首次小于 5%?考察点:创建列、索引df1 =...原创 2020-05-01 23:45:12 · 437 阅读 · 0 评论 -
数据分析之pandas-第5章 合并
pandas学习 第5章 合并一、append与assignappend方法(a)利用序列添加行(必须指定name)df_append = df.loc[:3,['Gender','Height']].copy()df_appends = pd.Series({'Gender':'F','Height':188},name='new_row')df_append.append(...原创 2020-04-30 20:41:36 · 239 阅读 · 0 评论 -
数据分析之pandas-第4章 变形
pandas学习-第4章 变形一、透视表二、其他变形方法三、哑变量与因子化四、问题与练习问题【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。【问题二】 变形函数和多级索引是什么关系?哪些变形函数会使得索引维数变化?具体如何变化?【问题三】 请举出一个除了上文提过的关于哑...原创 2020-04-28 17:30:45 · 284 阅读 · 0 评论 -
数据分析之pandas-第3章 分组
pandas学习-第3章 分组一、SAC过程内涵SAC指的是分组操作中的split-apply-combine过程split指基于某一些规则,将数据拆成若干组apply是指对每一组独立地使用函数combine指将每一组的结果组合成某一类数据结构apply过程在该过程中,我们实际往往会遇到四类问题:整合(Aggregation)——即分组计算统计量(如求均值、求每组元...原创 2020-04-26 19:34:48 · 365 阅读 · 0 评论 -
数据分析之pandas-第2章 索引
pandas学习-第2章 索引一、单级索引loc方法iloc方法[]操作符1、loc方法(注意:所有在loc中使用的切片全部包含右端点!)df.loc[行号]df.loc[[起始行,结束行]]# 单行索引df.loc[1103]# 多行索引df.loc[[1102,2304]] #从1102行到2304行,包括2304行df.loc[[1304:]] #从1102行到...原创 2020-04-23 19:02:03 · 346 阅读 · 0 评论 -
jupyter notebook快速切换code和markdown
jupyter notebook快速切换code和markdown众所周知,jupyter notebook适合写代码的同时也可以用来做文档。在编写的过程中需要经常切换code和markdown这两种模式。记下快捷操作会节省很多力气~总结:代码转为markdown: Esc + M(+号不用按)markdown转为代码:Esc + Y如下图所示,绿色框框的时候表示当前处于代码模式...原创 2020-04-18 22:59:43 · 10182 阅读 · 0 评论