- 博客(6)
- 收藏
- 关注
原创 hive分位函数percentile和percentile_approx误区和解决方案
percentile和percentile_approx对分位数的计算
2023-07-21 14:47:05
5091
原创 什么是大数据?Hadoop概述、Hadoop基础
存储文件的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限等),以及每个文件的快列表和块所在的DataNode等。5. share目录:存放Hadoop的依赖jar包、文档、和官方案例,Hadoop各个模块编译后的jar包所在的目录。lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能),该目录下存放的是Hadoop运行时依赖的jar包。share目录:存放Hadoop的依赖jar包、文档、和官方案例,Hadoop各个模块编译后的jar包所在的目录。
2023-05-15 23:35:03
1667
原创 SQL书写规范/SQL编码规范,这一篇就够了
多层次的嵌套子查询别名之前要体现层次关系,SQL语句的别名需要分层命名,从第1层次至第4层次,分别用P(Part) 、S(Segment)、 U(Unit) 和D(Detail)表示。如果使用英文双引号引用的字符串内需要包含双引号时,除了使用转义的办法外,我们可以用一对单引号来包括字符串,这样字符串内的双引号被视作普通字符,无需特殊处理。缩进应为1个Tab或者4个字符,所有的缩进均为1个缩进量的整数倍,按照代码层次对齐,同层次的SQL语句缩进应保持一致(纵向对齐)。合理的代码注释也有助于对代码的理解。
2023-05-03 02:06:31
4842
1
原创 解决工厂日、工厂月、工厂年问题全过程及其在数仓建模过程中的运用
本文解决的问题场景运用面较窄,但是涉及存储过程、维度建模、星型模型反规范化等方面的综合运用,创作目的在于为此类问题打开一个角度,供借鉴。
2023-05-03 00:05:48
308
1
原创 addax/datax错误日志:执行数据库 Sql 失败, 请检查您的配置的 column/table/where/querySql
addax/datax错误日志:执行数据库 Sql 失败, 请检查您的配置的 column/table/where/querySql
2022-06-13 16:14:38
1455
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人