-------14.8. Hive & Pig
在风中的意志
这个作者很懒,什么都没留下…
展开
-
Hive 基本操作命令
前言前面两章, 我们介绍了如何安装Hive和如何远程链接Hive. 本章, 我们介绍下Hive的基本文件结构和操作.基础知识Hive的所有数据都存储在HDFS上, 没有专门的数据存储格式(支持 Text、SequenceFile、ParquetFile、RCFILE等) (Text与SequenceFile为Hadoop自带的文件格式, ParquetFile与RCFILE为两个不同的公...原创 2019-04-08 23:58:03 · 5989 阅读 · 1 评论 -
Hive Client JDBC
前言在前面的章节内, 我们介绍了Hive的安装、远程链接和基本使用. 本章, 我们介绍下如何在Java内完成这些操作.正文pom.xml 文件<dependencies> <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-jdbc&...转载 2019-04-10 23:31:17 · 536 阅读 · 0 评论 -
Hive SQL 练习
前言本章主要, 转载一篇Hive SQL的一些练习题. 做一做, 练习下做业务的能力.本文相关资源, 可在我的Github项目 https://github.com/SeanYanxml/bigdata/ 目录下可以找到. PS: (如果觉得项目不错, 可以给我一个Star.)正文表1 学生表 <学号,姓名,性别,年龄,系> - <Sno,Sname,Ssex,Sag...原创 2019-04-10 23:57:48 · 675 阅读 · 0 评论 -
Hive 的安装与配置
前言在前面的章节内, 我们主要介绍了Hadoop体系内的相关知识. 本章中, 我们介绍下Hive的安装与使用.什么是Hive?个人认为, Hive是用来简化Hadoop的Map/Reduce操作的工具架构. 方便统计与搜查Hadoop表形式文件. 后继者Spark SQL与其特别的相似.安装Hive的安装主要包括如下几步:下载安装包到本地, 解压. http://mirror....原创 2019-04-04 17:31:44 · 771 阅读 · 0 评论 -
Hive 基本命令
前言总结的Hive相关命令. 网上的排版略差, 重新排版记录于此.DML建表CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type[COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_nam...转载 2019-04-09 01:19:23 · 477 阅读 · 0 评论 -
Hive 远程链接(hiveserver2/beeline)
前言在上一章内, 我们安装了Hive, 并初次尝试了创建表和查询表的操作. 在本章内, 我们继续上章的内容了解Hive的相关操作.基础知识Hive的所有数据都存储在HDFS上, 没有专门的数据存储格式(支持 Text、SequenceFile、ParquetFile、RCFILE等) (Text与SequenceFile为Hadoop自带的文件格式, ParquetFile与RCFILE...原创 2019-04-08 16:51:59 · 2923 阅读 · 0 评论 -
Hive 相关问题
前言本章主要收集一些Hive经常会遇到的问题. 由于本人没有在生产环境内使用过Hive. 所以, 本节的内容多为转载.相关问题数据倾斜问题?Hive的HQL语句及数据倾斜解决方案hive数据倾斜优化策略Hive数据倾斜解决方法总结大数据常见问题之数据倾斜Hive多表Join操作hive进行多表join如何处理hive的6种join操作轻松玩转hive中各种join之...原创 2019-04-09 00:10:00 · 274 阅读 · 0 评论