Hive

本文适合初学者,介绍了Hive作为数据仓库的基础知识,包括数据仓库的概念、数据模型(星型和雪花型)、Hive的安装、Hive-Cli命令以及如何通过HQL进行数据查询。Hive将数据存储在HDFS上,提供类SQL查询功能,其元数据存储在metaStore中,并可通过控制台、CLI或JDBC接口操作。
摘要由CSDN通过智能技术生成

本文适合初学者学习

  • 数据仓库
  • Hive介绍
  • Hive安装

数据仓库

数据仓库建立
数据仓库是面向主题的数据库
在这里插入图片描述

  • OLTP应用
    面向事务

  • OLAP应用
    面向查询

数据仓库数据模型
  • 星型模型(主题固定)
    主题:商品推荐
    相关:客户、促销、订单、厂家、物流
  • 雪花模型(主题发散)
    主题:客户推荐
    相关:家庭、教育背景、住址
    家庭为主题相关:xxx
    教育背景为主题相关:xxx
    住址为主题相关:xxx

Hive

  • Hive是建立在HDFS上的数据仓库
  • Hive可以对数据ETL
  • Hive定义类SQL查询语句,靠HQL解析引擎转成MR-Job在Hadoop上执行
  • Hive的表其实就是HDFS的目录/文件

Hive元素据

metaStore:包括表名、列名、分区名、表属性、数据所在目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值