1.数据仓库软件
2.存储,重在分析,延迟高
3.使用SQL来读,写,管理驻留在分布式存储系统大型数据集,可以使用命令行和Driver链接
到Hive
4.运行在hadood之上,用来汇集查询数据
OLAP: online analyze process
不是:
关系型数据库
OLTP
不适合实时查询和底层更新操作
特点:
在数据库中存放schema,处理数据到HDFS
OLAP
提供类SQL语言,HQL(HiveQL)
可扩展就,可伸缩,速度快
Hive架构
------------------------------------------------------------------------------
UI
MetaStore //schema,taable,clumn信息在RDBMS
HQL Prcess Ebgein //编写SQL代替MR程序
Excution Ebgine //处理查询语句,生成结果
HDFS