自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Hive和Spark的几种集成方式

Spark with Hive、Hive on Spark、Spark on yarn

2022-11-18 09:24:33 1267 1

原创 【数据仓库】指标体系

指标体系系统输出的业务指标不需要是指标的具体展现,只需要输出指标的部分数据就可以了,在业务人员确认输出的指标与业务需求一致时,可以再联系开发人员开发BI报表;开发新的指标需要如何命名,存放?在统计梳理完所有的业务指标之后再和业务方沟通,明确指标口径,统一指标的命名规范,并将指标分类,划分数据域和指标层级。这一部分的工作主要是将所有指标进行规范的开发,不需要了解具体的业务指标是什么,下面是一个指标设计的实例。在指标设计完之后,需要和梳理业务指标的同事沟通,指标的命名和划分,业务指标的设计通常由开发人员完成。

2022-11-18 09:17:51 474

原创 HiveSQL优化

Hive SQL的执行,Hive的驱动器对SQL进行解析优化,从HDFS获取数据,然后转化为MapReduce,提交到Hadoop集群运行所以Hive SQL的优化从下面三点来执行。

2022-11-18 09:08:30 543

原创 Hive常用函数——UDF、UDAF、UDTF、Lateral view

Hive的函数分为三类,分别是UDF、UDAF、UDTF,简单区分这三类函数就是。

2022-11-18 09:05:23 1478

原创 Hive解析json字符串(json数组)

如何使用Hive 解析json字符串

2022-11-18 08:56:56 1783

原创 hive的多维数据分析

hive sql的多维分析实现 with cube,with rollup,grouping sets

2022-06-19 18:30:00 820

原创 数据仓库分层

数据仓库分层

2022-06-14 00:00:00 296

原创 数仓维度建模

维度建模方法论

2022-06-12 21:40:36 530

原创 hive sql的行列转换

hive-sql 行列转换

2022-06-07 22:36:37 283

原创 Hive之udf开发日记

Java sql解析,提取表名hive udf开发流程

2022-06-03 16:23:52 650

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除