HIVE入门(概述、hive的体系结构)

本文是关于HIVE的入门教程,首先介绍了数据仓库的基本概念,包括星型模型和雪花模型,然后详细阐述了HIVE的体系结构,涵盖了元数据以及HQL的执行过程。
摘要由CSDN通过智能技术生成

第一章 概述

1-1 课程概述

什么是hive?
答:hive构建在hadoop hdfs 上的数据仓库。

什么是数据仓库?
答:数据仓库实际上就是一个数据库,数据仓库的特点:引入冗余,分析数据;
数据库的特点:避免冗余,捕获数据。

1-2 数据仓库简介

什么是数据仓库?
答:数据仓库是一个面向主题的,集成的,不可更新的,随时间不变化的数据集合,
它主要用于支持企业或组织的决策分析处理。

数据仓库的结构和建立过程
答:
1、数据源 (业务数据系统、文档资料、其他数据)
2、数据存储及管理-ETL (抽取Extract、转换Transform、装载Load)
3、数据仓库引擎 (服务器)
4、前端展示 (数据查询、数据报表、数据分析、各类应用)

OLTP应用和OLAP应用
答:
1.OLTP(on-line transaction processing) 联机事务处理
例:银行转账
2.OLAP(on-line analytical processing) 联机分析处理
例:商品推荐系统

数据仓库中的数据模型

1、星型模型

2、雪花模型

1-3 什么是hive

答:
hive是建立在hadoop hdfs 上的数据仓库基础架构。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值