什么是Hive

原创 2016年08月28日 16:20:44

Hive 是建立在 Hadoop  上的数据仓库基础构架。

它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。

Hive 定义了简单的类 SQL  查询语言,称为 QL ,它允许熟悉 SQL  的用户查询数据。

同时,这个语言也允许熟悉 MapReduce  开发者的开发自定义的 mapper  和 reducer  来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。

Hive的表其实就是HDFS的目录,按表名把文件夹分开。如果是分区表,则分区值是子文件夹,

可以直接在M/R Job里使用这些数据。

Hive 相当于hadoop的可视化工具,如Mysql的可视化工具Navicat for MySQL,

oracle的可视化工具PLSQLDeveloper它可以起很多个,而且起不同版本的。

只要环境参数配置好了。就像Navicat for MySQL和sqldeveloper可以开多个。

Hive的数据存储基于Hadoop HDFS

Hive没有专门的数据存储格式存储结构主要包括:数据库、文件、表、视图、索引。
Hive默认可以直接加载文本文件(TextFile),还支持SequenceFile、RCFile。




版权声明:本文为原创文章,转载请注明出处:http://blog.csdn.net/zengmingen。-松门一枝花csdn博客

相关文章推荐

hive 整合 hbase

  • 2017-10-10 20:27
  • 14KB
  • 下载

hive优化经典.pdf

  • 2017-09-30 17:51
  • 225KB
  • 下载

hive中rcfile orcfile和parquetfile对比

hive中rcfile orcfile parquet性能对比

Hive编程指南

  • 2017-09-30 10:15
  • 26.80MB
  • 下载

hive函数大全

  • 2017-06-12 12:02
  • 24KB
  • 下载

Hive_4. DML -- 数据转换

前面介绍了 Hive 中的 DDL 语言,接下来我们将具体看看 HIve 中对数据的具体操作。本篇将主要探讨如何使用 LOAD, INSERT, IMPORT 和 EXPORT关键词来进行数据转换操作...

HIVE13BIN_HADOOP_SPARKSQL

  • 2016-09-29 22:19
  • 51.73MB
  • 下载

apache-hive-0.13.1-bin.tar

  • 2017-08-11 17:19
  • 51.73MB
  • 下载

Hive安装极其用法(个人觉得适合初学者)

Hive安装,用途,以及常用语法!

Hive的数据存储模式

  • 2017-10-08 17:44
  • 639KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)