Hive系列之——Hive特性解析并与传统数据库对比

最新推荐文章于 2024-05-24 21:19:55 发布

丁点儿印记

最新推荐文章于 2024-05-24 21:19:55 发布

阅读量815

点赞数 1

分类专栏：数据库文章标签：编程数据库 Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bingchenwurao/article/details/102750281

版权

文章目录Hive入门详解及主要特点总结Hive概述Hive原理Hive的DDL语句：hive的DQL操作Hive入门详解及主要特点总结本文主要总结HIve自身的一些特点，并对其中的一些点和传统数据库做对比，能够更好的理解Hive。Hive详细入门介绍看下方链接，有原理，有案例，讲的很通俗移动。链接易学教程——Hive入门详解Hive概述Hive是Hadoop上的数据仓库工具，处理的是结...

摘要由CSDN通过智能技术生成

文章目录

Hive入门详解及主要特点总结

Hive入门详解及主要特点总结

本文主要总结HIve自身的一些特点，并对其中的一些点和传统数据库做对比，能够更好的理解Hive。
Hive详细入门介绍看下方链接，有原理，有案例，讲的很通俗易懂。
链接易学教程——Hive入门详解

1、Hive概述

Hive是Hadoop上的数据仓库工具，处理的是结构化数据。注意：定位是数据仓库，所以适用于实时性要求不高的场合。
Facebook设计Hive时针对的业务场景就是处理海量结构化日志。

2、Hive原理

Hive提供的语言是HQL，类似于SQL，但有一些差别，比如没有update语句，对应的是覆盖语句insert overwrite，等其他差异。

Hive区别于其他大数据技术相关数据库的最大优势是：提供了类似于SQL的语法，容易上手，但是后台实际执行却用了大数据技术。

开发人员在操作接口提交类SQL语法，Hive后台执行时会把HQL语法转化成MapReduce作业。

Hive处理的数据是存储在HDFS上。
操作数据的是MapReduce作业。
MapReduce是运行在Yarn上。

3、Hive的DDL语句：

3.1 Hive提供快速建表语句

  create table if not exists student_temp like student;

创建表时可以用 if not exists语句判断表是否存在，可以用like快速复制表结构。这点DB2数据也支持
3.2 Hive表分为内部表和外部表
内部表就是所谓的管理表，是实体表。删除内部表数据也会同时被删除。
外部表并不拥有这份数据，删除表不会删除数据，只会删除外部表的元数据。
其实内部表和外部表类似于传统数据库中表和视图的概念。内部表就是表，外部表相当于视图。
3.3 分区表 partitioned
hive的分区表的相当于在目录下创建多个文件夹存放不同数据。多级分区表就是建多级多个目录。

\table_trx_inf\2018\11
\table_trx_inf\2018\12
\table_trx_inf\2019\01
\table_trx_inf\2019\02
…
交易表table_trx_inf是两级分区表,分区字段是year和month

3.1.1 hive分区表特殊点：
各个分区表在物理上是单独为目录文件，在逻辑上也不是一个表。因为对它操作是要具体某个分区的。
如：
a. 加载数据

load data local inpath

最低0.47元/天解锁文章

丁点儿印记

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive系列之——Hive特性解析并与传统数据库对比

文章目录Hive入门详解及主要特点总结Hive概述Hive原理Hive的DDL语句：hive的DQL操作Hive入门详解及主要特点总结本文主要总结HIve自身的一些特点，并对其中的一些点和传统数据库做对比，能够更好的理解Hive。Hive详细入门介绍看下方链接，有原理，有案例，讲的很通俗移动。链接易学教程——Hive入门详解Hive概述Hive是Hadoop上的数据仓库工具，处理的是结...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。