大数据之Hive
文章平均质量分 71
CoderLin很忙
欢迎来到ABC时代~
展开
-
Hive查询函数的总结和案例(一)
NVL空字段赋值NVL(value, default_value):如果value为NULL,则NVL函数返回default_value(可以为常量,也可以为某个字段)的值,否则返回value的值,如果两个参数都为NULL,则返回NULL。此函数很简单,此处不写例子。CASE WHEN和IFcase when有如下两种形式:case 字段when 条件值1 then 值1when 条件...原创 2019-03-02 16:35:44 · 903 阅读 · 1 评论 -
Hive的架构和原理
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL(HQL)查询功能。Hive是将HQL转化为MapReduce程序,Hive处理的数据存储在HDFS上,执行程序运行在Yarn上。由于执行的是MapReduce程序,延迟比较高,因此Hive常用于离线的数据分析。Hive架构图Client:用户接口CLI(command-line interf...原创 2019-02-27 12:03:16 · 2333 阅读 · 0 评论 -
Hive开窗函数和Rank函数
开窗函数over():跟在聚合函数后面,指定分析函数工作的数据窗口大小,决定了数据的聚合范围,默认范围是整个数据窗口,即所有行。可使用partition by将数据进行分组聚合;使用order by除了排序,还会改变聚合范围(从开始行到当前行的聚合)。如下的窗口字句,能对聚合数据进一步的划分current row:当前行n preceding:往前n行数据n following:往后n行...原创 2019-03-04 16:42:07 · 1217 阅读 · 0 评论 -
Hive支持Update和Delete语句
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update文档说了hive从0.14开始支持的update和delete语句,我使用的hive是1.2.1版本。首先在hive-site.xml里配置如下属性: <property> <...原创 2019-08-13 12:19:44 · 10219 阅读 · 0 评论