Hive
:由
Facebook
开源用于解决海量
结构化
日志的数据统计工具。
Hive
是基于
Hadoop
的一个
数据仓库工具
,可以将
结构化的数据文件映射为一张表
,并
提供
类
SQL
查询功能
Hive 本质
:将
HQL
转化成
MapReduce
程序
1
)
Hive
处理的数据存储在
HDFS
2
)
Hive
分析数据底层的实现是
MapReduce
3
)执行程序运行在
Yarn
上
HQL与SQL区别:
由于 Hive 是针对数据仓库应用设计的ÿ