大数据学习(08)--Hadoop中的数据仓库Hive

目录

1.什么是数据仓库?

1.1数据仓库概念

在这里插入图片描述

对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。

1.2传统数据仓库面临的挑战

在这里插入图片描述

1.3 Hive介绍

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Hbase支持快速的交互式的大数据应用
pig,Hive支持批量式的数据分析业务

1.4 Hive与传统数据库的对比

在这里插入图片描述

1.5 Hive在企业中的部署与应用

在这里插入图片描述

2.Hive系统架构

在这里插入图片描述

Microsoft推出的ODBC(Open Database Connectivity)技术 [1] 为异质数据库的访问提供了统一的接口
JDBC(Java Data Base Connectivity,java数据库连接)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。
CIL (Common Intermediate Language) 公共中间语言

3.Hive工作原理

3.1 SQL转换为MapReduce作业的基本原理

在这里插入图片描述
在这里插入图片描述

3.2 Hive中SQL查询转换MapReduce作业的过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.Hive HA基本原理

在这里插入图片描述

5.Impala

5.1 Impala介绍

在这里插入图片描述

5.2 Impala系统架构

在这里插入图片描述
在这里插入图片描述

5.3 Impala查询执行过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.4 Impala和Hive的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.Hive编程实践

参考博客

6.1 Hive的安装和配置

在这里插入图片描述

6.2 Hive的基本数据类型

在这里插入图片描述
在这里插入图片描述

6.3 Hive的基本操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.4 Hive的应用实例(wordCount)

在这里插入图片描述在这里插入图片描述

6.5 Hive的优势

在这里插入图片描述

7.总结

在这里插入图片描述

  • 19
    点赞
  • 111
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值