hive编程指南--hive基础知识

最新推荐文章于 2020-09-09 11:06:02 发布

qqjlove

最新推荐文章于 2020-09-09 11:06:02 发布

阅读量2.4k

点赞数

分类专栏： hive 文章标签： hive hadoop 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiong_yao/article/details/50327387

版权

hive 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1：Hive不是一个完整的数据库。Hadoop以及HDFS的设计本身约束和局限性得限制了Hive能够胜任的工作。其中最大的限制就是Hive不支持记录级别的更新

插入或者删除操作。但是用户可以通过查询生成新表或者将查询结果导入到文件中。同时，因为Hadoop是一个面向批处理的系统，而MapReduce任务的启

动过程需要消较长的时间，所以hive查询延时比较严重。传统数据库中秒级可以完成的查询，在Hive中，即使数据集相对较小，往往也需要执行更长的时间，

最后需要说明的是，hive不支持事物。

Hive组成模块

2：所有的命令和查询都会进入到Driver(驱动模块)，通过该模块对输入进行编译，对需求的计算进行优化，然后按照指定的步骤zhixing（通常是启动多个MapReduce任务来执行）。当需要启动MapReduce任务时，hive本身是不会生成Java内置的，原生的mapper和reducer模块。

3：Metastore（元数据存储）是一个独立的关系型数据库(通常是一个MySql实例)，Hive会在其中保存表模式和其他系统元数据

4：Hive 中所有的数据都存储在 HDFS 中，Hive 中包含以下数据模型：Table，External Table，Partition，Bucket。

5：所有的Hive客户端都需要一个metastoreservice（元数据服务），Hive使用这个服务来存储表模式信息和其他元数据信息，通常情况下会使用一个关系型数据库中的表来存储这些信息。默认情况下，hive会使用derby sql服务器，可以提供有限的，单进程的存储服务。对于集群来说，需要使用MySql或者类似的关系型数据库。

6:默认情况下，Hive是不允许用户删除一个包有表的数据库的。用户要么先删除数据库中的表，然后再删除数据库；要么在删除命令的最后加上关键字CASCADE

这样，可以使Hive自行删除数据库中的表。

Hive->DROP DATABASE IF EXISTS databasename CASCADE;

7:可以使用DESCRIBE tablename;详细描述表的信息结构。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。