Hive原理

Point 1:
结构化数据:有具体的列和行,并且代表什么具体的含义,相当于一张表—mysql
非结构化数据:没有具体的行和列,完全没有规律——–nosql

Point 2:什么是Hive?
Hive:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

Point 3:Hive的优点
其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

Point 4:
Hive的架构:
解释器(翻译器)—————将Hive 语句转换为MapReduce程序
编译器————————–将转换后的MapReduce程序达成jar包
优化器————————–提交jar包,执行程序

Point 5:什么是映射数据?
Hive的使用需要有一个映射数据库,需要永久保存(所以借鉴了一个关系型数据库—RDBMS—元数据),将HDFS的数据映射在HIVE,而元数据还是存放在原平台上,HIVE和RDBMS可以不在一台机器上

Point 6:
Hive的底层(进口)可以存储各种数据,包括结构化数据和非结构化数据,因为Hive只是一个仓库,用于存储,当需要某数据的时候,只需要一条SQL语句对出口查询

Point 7:
HIVE不存在要分析的目标数据,而是存在底层,比如Hadoop,借助HDFS进行存储

Point 8:
HIVE是一个工具,不是一个服务,不存在HA

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值