自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Starrocks集群部署

背景:最近几年OLAP数据库可谓是百家争鸣,许多产品都陆陆续续的展现出来,不过最近据说StarRocks的综合能力比较好,对比于Clickhouse这种强大的竞品也毫不逊色! 下方是官方给出的一些资料介绍,我这里截取了几张比较重要的图(官方文档传送门:StarRocks @ StarRocks_intro @ StarRocks DocsStarRockshttps://docs.starrocks.com/zh-cn/main/introduction/StarRocks_intro) 1.发展路程

2022-04-23 19:26:08 6119 2

原创 hsql获取数组中最后一个值的写法

sql获取数组中最后一个值的写法

2022-04-12 18:28:27 1622

原创 图解数据仓库之拉链表,超简单!

图解数据仓库之拉链表,超简单! 1.背景分析 2.图解拉链表形成过程 1)下图为业务后台数据库中每日的数据变化情况,每天只保留客户最新手机号码。 2)根据最后修改时间字段从业务后台数据库抽取最新被修改数据,形成分区表。 3.过程分析 4.评价 写在最后 ...

2020-10-15 18:05:02 4052 2

原创 MySQL中row_number的实现

MySQL中row_number的实现 一 、背景: 一般在数据仓库环境中,我们可以很方便的使用row_number函数根据某个维度来对数据进行分组,实现每个组内数据编号排序的效果。如下图所示,该图是在mysql环境中生成的效果图,这里以lcid进行的分组,num等价于row_number函数实现的效果: 二、实现过程 1.设置mysql变量 设置两个变量 set @row_number:=0;--根据lcid_no的判断结果生成row_number序号 set @lcid_no:= 0; --

2020-10-12 16:22:44 4095 3

原创 sql解析json数据

之前在工作中使用遇到的一些问题,下面把这些情况给简单分享一下,不多说,直接上问题。 1.问题背景 json格式数据如下图所示,b是一个对象数组,里面包含四个对象,现在需要解析出每个数组中的spid,一般来说数组中包含的对象个数为0-n,是一个不确定的数,下图图二实例为4个。 图一 图二 2.实现思路 1.使用get_json_object()函数 2.配合正则解析实现任意个匹配 3.代码实现 select imp_date, get_json_object(your_c.

2020-08-03 16:05:22 6083

原创 sql针对某字段中的内容去重

之前在工作中使用遇到的一些问题,下面把这些情况给简单分享一下,不多说,直接上问题。 1.问题背景 将上图数据效果转化为下图效果效果 manager ["aa","aa","aa","bb","bb"] ["cc","cc","dd"] ["1","2","1","2","3"] manager aa,bb cc,dd 1,2,3 2.实现思路 第一步使用lateralexplode()函数侧视图打开manager列 第二步使用wm_concat()函数结合gro..

2020-08-03 15:19:37 1686

原创 Hive数据仓库之金融业务-业务实战一

业务名称:某金融公司所属营业部月交易量前10的客户的客户 技术描述: 1.数据接入 数据来源于柜台系统中的业务表和凌志营销一体化系统中的表 系统数据库1: hive_s5_szdb_sz_asset_client hive_s5_szdb_sz_his_his_deliver hive_s5_szdb_sz_his_his_fundjour hive_s5_szdb_sz_his_his...

2019-05-08 22:27:00 1059

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除