自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Hive表获取字段状态变化记录-Lag函数应用

场景:日志表中记录了关于某个实体的状态变化所有信息,想单单提取出,按照时间轴顺序,发生了状态变化的数据行;思路:Lag函数或者Lead函数可以将上一行或者下一行的字段内容获取到本行,这样可以比较字段是否发生变化,进而判断是否状态变化,是否需要提取出该数据行;实现SQL:1. 数据行内容select house_id, status, create_t

2017-02-28 09:40:16 2051

原创 Mongodb数据同步到Hive

思路:利用Mongodb的export工具导出数据成json格式;             load该json数据到临时hive表的一个字段;             从该临时hive表解析json落地成最终的表;代码:1. 利用Mongodb的export工具导出数据成json格式$mongo_path/bin/mongoexport -h $host:27017 -u

2017-02-27 21:01:23 1699

原创 HIVE下分布式生成整型唯一ID

场景:hive下target_table表id字段需要唯一实现方法代码如下:select t2.rn+row_number() over() as id, t1.afrom ( select 1 as a union all select 2 as a union all select 3 as a union all

2017-02-27 20:26:26 2678

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除