《hive编程指南》阅读笔记摘要（一）

最新推荐文章于 2024-02-22 09:20:29 发布

will的成长之路

最新推荐文章于 2024-02-22 09:20:29 发布

阅读量3.6k

点赞数 1

分类专栏：大数据文章标签： hive权威指南笔记 hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/matthewei6/article/details/63685025

版权

第一二章基础知识、基础操作
hive的缺点
1、hive不支持记录级别的增删改操作，但是用户可以通过查询生成新表或者将查询结果导入到文件中。
2、Hive的查询延时很严重，因为MapReduce job的启动过程消耗很长时间，所以不能用在交互查询系统中。
3、hive不支持事务。

hive最适合做数据仓库
HiveQL不符合ansi sql标准，和mysql、oracle的sql有很多差异。

mapreduce处理输入的文档时，传给mapper的key是文档中这行的起始位置的字符偏移量，value是这行文本。
对程序员透明的事情，也是hadoop神奇的地方是，hadoop会自动执行排序sort和重新洗牌发牌shuffle的过程：对mapper输出的key/value进行排序，然后洗牌发牌：将相同键的key/value对发给同一个reducer。

访问hive的方式有Cli，HWI（web界面），JDBC，ODBC，thrift（hive有thrift服务器）等方式。
所有的查询和操作都会进入到Driver模块
hive不必和mapreduce服务部署在相同的节点上
hive的元数据metadata会保存在关系型数据库中，如Derby、mysql等，metadata包括表模式（表结构）等信息

HBase相

最低0.47元/天解锁文章

will的成长之路

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
《hive编程指南》阅读笔记摘要（一）

第一二章基础知识、基础操作hive的缺点1、hive不支持记录级别的增删改操作，但是用户可以通过查询生成新表或者将查询结果导入到文件中。2、Hive的查询延时很严重，因为MapReduce job的启动过程消耗很长时间，所以不能用在交互查询系统中。3、hive不支持事务。hive最适合做数据仓库HiveQL不符合ansi sql标准，和mysq
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。