
hive
文章平均质量分 91
hive
王亭_666
这个作者很懒,什么都没留下…
展开
-
业务场景中Hive解析Json常用案例
json_serde库提供了一种在Hive中直接将JSON格式的数据解析成表的方式,可简化处理流程。现在希望建立一张表,使得表可以直接映射上数据文件hive中建表age int,将json文件上传至建表对应hdfs路径# 也可以通过hive的sql命令行直接load数据文件查看表数据验证可以看到数据文件8行记录,成功映射对应了hive中wangt_666_json表的8条数据。原创 2023-12-04 18:00:31 · 1598 阅读 · 0 评论 -
Hive中高频常用的函数和语法梳理及业务场景示例
函数在Hive中被广泛使用,可以用于数据清洗、转换、计算和分析等各种业务场景。根据具体的需求,选择合适的函数可以提高查询和处理数据的效率,并实现所需的功能原创 2023-06-29 17:09:45 · 2040 阅读 · 0 评论 -
Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)15-28章
Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)15-28章语法规则:join语法丰富化Hive中join语法从面世开始其实并不丰富,不像在RDBMS中那么灵活从Hive 0.13.0开始,支持隐式联接表示法。允许FROM子句连接以逗号分隔的表列表,而省略JOIN关键字从Hive 2.2.0开始,支持ON子句中的复杂表达式,支持不相等连接(请参阅HIVE-15211和HIVE-15251)。在此之前,Hive不支持不是相等条件的联接条件join查询实验数据环境准备建表语句原创 2022-10-24 12:30:21 · 2135 阅读 · 0 评论 -
Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)1-14章
Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)1-14章Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)15-28章数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。数据仓库为了分析数据而来,分析结果给企业决策提供支撑。企业中,信息数据总是用作两个目的:(1)操作型记录的保存(2)分析型决策的原创 2022-10-24 12:28:49 · 3204 阅读 · 0 评论 -
Hive简介及hive部署、原理和使用介绍
Hive简介、原理及hive部署和使用介绍Hive简介Hive概念Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序【注意】:(1)被Hive处理的数据存储在HDFS上,并不是Hive本身用的数据库(2)Hive分析数据底层的实现是MapReduce,并不是hql直接对上数据底层(3)执行程序运行在Yarn上Hive的翻译 2021-04-03 19:24:57 · 996 阅读 · 0 评论