- 博客(5)
- 收藏
- 关注
原创 Pandas reshape相关函数介绍(pivot,pivot_table,stack,unstack,melt)
0.背景在Pandas的使用中,常常需要到行列切换的情况,即所谓的数据透视表,这里根据Pandas当中的此类专题进行总结,主要解析pivot,melt,stack,unstack几个函数的使用。**1.pivot(一定要看下pivot_table)pivot做的就是从源数据构造透视表的过程,透视表是在数据统计中一个数据汇总的方式。pivot使用例子如下所示。import pan...
2018-08-31 20:11:50 11178 3
原创 Hive当中实现pivot操作
0.背景实际工作当中遇到这样一个问题,数据如下,但是我想通过SQL将数据转换成按列展示的形式,即常用的pivot透视操作。# 原始数据id item value1 a 10 2 b 211 b 152 a 20# 次级目标格式(SQL)id itemValue1 a-10,b-152 a-20,b-21# 目标格式id it...
2018-08-31 13:38:05 13508 3
原创 使用国内镜像修改pip源
0.背景博主通常使用anaconda来管理Python环境,但是anaconda有个问题就是包的更新并不及时,在pandas已经有0.23版本的时候anaconda当中仍然只有0.20版本。所以我们有时候需要使用pip进行安装。但是由于网络问题,使用pip安装通常很慢。本文介绍常用的pip国内源,以及替换源的方法。1.临时使用国内源如果只是暂时使用国内源,那么pip install -...
2018-08-22 10:55:29 17167 1
原创 Python中for后接else的语法
0.背景今天看到了一个比较诡异的写法,for后直接跟了else语句,起初还以为是没有缩进好,查询后发现果然有这种语法,特此分享。之前写过c++和Java,在for后接else还是第一次见。1.试验# eg1import numpy as npfor i in np.arange(5): print ielse: print("hello?")# 0# 1...
2018-08-21 20:08:25 38059 7
原创 Pandas中使用loc将列表等集合赋值给行或列的每一个元素
0.背景在使用Pandas进行数据处理过程当中,有时候需要将数据的某一列都赋值为某一个列表的形式。但是如果列的元素个数与列表的元素个数相同时赋值,会导致列表中的每一个元素对应到了列的一个表格中(详情见下)。本文即解决这样的问题。1.对应赋值import pandas as pdimport numpy as npdata = pd.DataFrame({"A":np.aran...
2018-08-08 16:23:11 15676
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人