SQL
查询功能,
可以将
SQL
语句转换为
MapReduce
任务进行运行,
通过自
己的
SQL
去查询分析需要的内容,这套
SQL
简称
Hive
SQL
,使不熟悉
mapreduce
的用户很
方便的利用
SQL
语言查询,汇总,分析数据。
2
、
HIVE
适用性:
它与关系型数据库的
SQL
略有不同,
但支持了绝大多数的语句如
DDL
、
DML
以及常见的
聚合函数、连接查询、条件查询。
HIVE
不适合用于联机(
online)
事务处理,也不提供实时
查询功能。它最适合应用在基于大量不可变数据的批处理作业。
HIVE
的特点
:可伸缩(在
Hadoop
的集群上动态的添加设备),可扩展,容错,输入格式的松散耦合。
hive
不支持用
insert
语句一条一条的进行插入操作,也不支持
update
操作。数据是
以
load
的方式加载到建立好的表中。
数据一旦导入就不可以修改。
DML
包括:
INSERT
插入、
UPDATE
更新、
DELETE
删除。
3
、
HIVE
结构
Hive
是建立在
Hadoop
上的数据基础架构,
它提供了一系列的工具,
可以用来进行数据
提取转化加载(
ETL
)
,这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机
制,
Hive
定义了简单的累
SQL
查询语言,
称为
HQL
,
它允许熟悉
SQL
的用户查询数据,
同时,
这个语言也允许熟悉
MapReduce
开发者的开发自定义的
mapper
和
reducer
来处理內建的
mapper
和
reducer
无法完成的复杂的分析工作。
3.1
、
Hive
架构
Hive
的结构可以分为一下几个部分:
(
1
)
用户接口
:用户接口主要有三个,
CLI,Client
和
WUL
。其中最常用的是
CLI
,
Cli
启动的时候,会同时启动一个
Hive
副本。
Client
是
Hive
的客户端,用户
连接至
Hive Server
。在启动
Client
模式的时候,需要指出
Hive Server
所在
的节点,并且在该节点启动
Hive Server
。
WUI
是通过浏览器访问
Hive
。