Hive home【Hive文档首页】

留着方便查询吧

Apache Hive

Apache Hive是一个建立在Apache Hadoop之上的数据仓库管理和查询软件。它提供了如下功能:

  • 对数据轻松进行ETL(extract/transform/load)的工具
  • 提供一种对各种结构数据的管理机制
  • 直接访问存储在HDFS或者其他数据存储系统之上的文件。例如Apache HBase
  • 通过查询语句执行MapReducer

Hive定义了一种类似SQL的查询语句叫QL(其实就是SQL了)。它还提供了高级的功能让熟悉MapReduce框架的程序员来自定义Map或者Reduce来实现更为复杂的分析工作。当然QL还支持扩展的自定义函数(UDF)、自定义聚合函数(UDAF)、自定义表函数(UDTF)。

Hive并不强制读取或者写入的数据使用特定格式。至于使用什么样的格式用户完全可以自己控制,详细见 File Formats and Hive SerDe in the Developer Guide

Hive并非设计用于OLTP系统因为它不支持实时查询或者行级的更新(要实现这块需要结合HBase)
。Hive最适用的场景是在大批量的数据处理作业上面(如web日志),Hive最重视的东西是可升缩性(跟M-R一样)、可扩展性、容错、松耦合格式的输入。

Hive包含两大组件HCatalog和WebHCat:

  • HCatalog 提供了基于Hadoop的元数据和数据表的管理。包括Pig和MapReduce。这样可以很轻松的进行数据读取和写入。其实就是hadoop之上的统一数据抽象服务。
  • WebHCat 提供了一个服务,你可以使用Hadoop MapReduce(or YARN)、Pig、Hive JOB或者执行Hive元数据操作使用HTTP(REST风格)接口。

Hive Documentation

一般信息

用户文档

管理文档

  • Installing Hive
  • Configuring Hive
  • Setting Up Metastore
  • Setting Up Hive Web Interface
  • Setting Up Hive Server (JDBC, ODBC, Thrift, HiveServer2)
  • Hive on Amazon Web Services
  • Hive on Amazon Elastic MapReduce
  • Hive on Spark: Getting Started

HCatalog and WebHCat 文档

  • HCatalog
  • WebHCat (Templeton)

资源贡献

Hive版本和分支

Realease NumberOriginal Number
1.1.00.15.0
1.0.00.14.0

Reference

https://cwiki.apache.org/confluence/display/Hive/Home

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值