自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Pandas reshape相关函数介绍(pivot,pivot_table,stack,unstack,melt)

0.背景在Pandas的使用中,常常需要到行列切换的情况,即所谓的数据透视表,这里根据Pandas当中的此类专题进行总结,主要解析pivot,melt,stack,unstack几个函数的使用。**1.pivot(一定要看下pivot_table)pivot做的就是从源数据构造透视表的过程,透视表是在数据统计中一个数据汇总的方式。pivot使用例子如下所示。import pan...

2018-08-31 20:11:50 11178 3

原创 Hive当中实现pivot操作

0.背景实际工作当中遇到这样一个问题,数据如下,但是我想通过SQL将数据转换成按列展示的形式,即常用的pivot透视操作。# 原始数据id item value1 a 10 2 b 211 b 152 a 20# 次级目标格式(SQL)id itemValue1 a-10,b-152 a-20,b-21# 目标格式id it...

2018-08-31 13:38:05 13508 3

原创 使用国内镜像修改pip源

0.背景博主通常使用anaconda来管理Python环境,但是anaconda有个问题就是包的更新并不及时,在pandas已经有0.23版本的时候anaconda当中仍然只有0.20版本。所以我们有时候需要使用pip进行安装。但是由于网络问题,使用pip安装通常很慢。本文介绍常用的pip国内源,以及替换源的方法。1.临时使用国内源如果只是暂时使用国内源,那么pip install -...

2018-08-22 10:55:29 17167 1

原创 Python中for后接else的语法

0.背景今天看到了一个比较诡异的写法,for后直接跟了else语句,起初还以为是没有缩进好,查询后发现果然有这种语法,特此分享。之前写过c++和Java,在for后接else还是第一次见。1.试验# eg1import numpy as npfor i in np.arange(5): print ielse: print("hello?")# 0# 1...

2018-08-21 20:08:25 38059 7

原创 Pandas中使用loc将列表等集合赋值给行或列的每一个元素

0.背景在使用Pandas进行数据处理过程当中,有时候需要将数据的某一列都赋值为某一个列表的形式。但是如果列的元素个数与列表的元素个数相同时赋值,会导致列表中的每一个元素对应到了列的一个表格中(详情见下)。本文即解决这样的问题。1.对应赋值import pandas as pdimport numpy as npdata = pd.DataFrame({"A":np.aran...

2018-08-08 16:23:11 15676

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除