hive官网翻译之总体概述

最新推荐文章于 2022-06-29 11:30:00 发布

shouwangV6

最新推荐文章于 2022-06-29 11:30:00 发布

阅读量3.3k

点赞数 1

分类专栏： hive 文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shouwangV6/article/details/52993382

版权

hive 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Apache Hive

hive官网原文地址 https://cwiki.apache.org/confluence/display/Hive/Home;jsessionid=91AF539FA31786D88F9DCAA009B31ED9

hive 数据仓库使用基于分布式存储和查询的sql语义，能够很方便地的读写，管理海量数据集。

基于hadoop,hive有以下特性：

1、通过sql工具能够很容易的访问数据，由此实现了数据仓管的功能如etl,报告，数据分析等。

2、提供对各种数据格式结构化的一种机制。

3、能够访问存储在hdfs或hbase中的文件。

4、查询引擎可以是Tez,Spark,MapReduce。

5、过程化语言hplsql。注：过程化语言即第三代语言c,c++，java

6、通过Hive LLAP,YARN或者Slider进行亚秒级查询。

hive提供了标准sql功能，包括许多SQL:2003和SQL:2011及以后版本的分析特性。用户可以通过UDFs,UDAFs,UDTFs添加自己的代码来扩展hive的sql功能。

hive支持多种数据存储格式，自带了用于逗号和制表符分割值的内置连接器，可用于（csv/tsv）文本文件，Parquet，ORC和其他格式文件。用户可以使用连接器来扩展对其他格式文件的支持，详细看File Formats and Hive SerDe 。
hive旨在是最大化可伸缩性（用多机器动态添加到hadoop集群的横向扩展）、性能、可扩展性、容错、解耦。hive不是为OLTP（在线事务处理）设计的，最好用来处理传统数据仓库任务。

hive的组件主要有HCatalog和WebHCat.

1、HCatalog是hadoop中表和存储的管理层，使用户能够用不同的工具如pig，mapreduce来处理不同的数据，在这个架构中能够很方便的读写数据。

2、WebHCat提供了这样一种服务，让你可以运行Hadoop的MapReduce,Pig,Hive任务，或者使用HTTP接口（Rest风格）来执行hive元数据的操作。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。