排序:
默认
按更新时间
按访问量
RSS订阅

Hive SQL 练习

前言 本章主要, 转载一篇Hive SQL的一些练习题. 做一做, 练习下做业务的能力. 本文相关资源, 可在我的Github项目 https://github.com/SeanYanxml/bigdata/ 目录下可以找到. PS: (如果觉得项目不错, 可以给我一个Star.) 正文 表1...

2019-04-10 23:57:48

阅读数 103

评论数 0

Hive Client JDBC

前言 在前面的章节内, 我们介绍了Hive的安装、远程链接和基本使用. 本章, 我们介绍下如何在Java内完成这些操作. 正文 pom.xml 文件 <dependencies> <dependency> <gro...

2019-04-10 23:31:17

阅读数 79

评论数 0

Hive 基本命令

前言 总结的Hive相关命令. 网上的排版略差, 重新排版记录于此. DML 建表 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type[COMMENT col_comment], ...)] ...

2019-04-09 01:19:23

阅读数 60

评论数 0

Hive 相关问题

前言 本章主要收集一些Hive经常会遇到的问题. 由于本人没有在生产环境内使用过Hive. 所以, 本节的内容多为转载. 相关问题 数据倾斜问题? Hive的HQL语句及数据倾斜解决方案 hive数据倾斜优化策略 Hive数据倾斜解决方法总结 大数据常见问题之数据倾斜 Hive多表Joi...

2019-04-09 00:10:00

阅读数 110

评论数 0

Hive 基本操作命令

前言 前面两章, 我们介绍了如何安装Hive和如何远程链接Hive. 本章, 我们介绍下Hive的基本文件结构和操作. 基础知识 Hive的所有数据都存储在HDFS上, 没有专门的数据存储格式(支持 Text、SequenceFile、ParquetFile、RCFILE等) (Text与Se...

2019-04-08 23:58:03

阅读数 59

评论数 0

Hive 远程链接(hiveserver2/beeline)

前言 在上一章内, 我们安装了Hive, 并初次尝试了创建表和查询表的操作. 在本章内, 我们继续上章的内容了解Hive的相关操作. 基础知识 Hive的所有数据都存储在HDFS上, 没有专门的数据存储格式(支持 Text、SequenceFile、ParquetFile、RCFILE等) (...

2019-04-08 16:51:59

阅读数 66

评论数 0

Hive 的安装与配置

前言 在前面的章节内, 我们主要介绍了Hadoop体系内的相关知识. 本章中, 我们介绍下Hive的安装与使用. 什么是Hive? 个人认为, Hive是用来简化Hadoop的Map/Reduce操作的工具架构. 方便统计与搜查Hadoop表形式文件. 后继者Spark SQL与其特别的相似. ...

2019-04-04 17:31:44

阅读数 51

评论数 0

提示
确定要删除当前文章?
取消 删除