分布式SQL计算Hive实操

数据仓库和数据库的理解:

数据库:是存储没有经过任何加工的原始数据的,通过数据库软件实现。数据库有很多表组成,每张表里面又有很多字段,因此能够通过表的二维来表现三维的关系。

数据仓库:是为了满足数据分析需要设计的,存储的是经过 ETL 过程的数据,能够反映相当长一段时间内的历史数据内容,是不同时间点数据库快照的集合。

数据仓库和数据库的区别:

1.数据库是面向事务的设计,数据仓库是面向主题设计的。

2.数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

3.数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。

4.数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

数据仓库的分层架构:

数据仓库架构可分为三层--源数据层、数据仓库层、数据应用层。

9998350729834d26a4c6d83716870418.jpg

数据库操作的基本命令语法:

SELECT ﹣从数据库中提取数据

UPDATE ﹣更新数据库中的数据

DELETE ﹣从数据库中删除数据

INSERT INTO -向数据库中插入新数据

CREATE DATABASE -创建新数据库

ALTER DATABASE -修改数据库

CREATE TABLE -创建新表

ALTER TABLE -变更(改变)数据库表

DROP TABLE -删除表

 CREATE INDEX -创建索引(搜索键)

 DROP INDEX -删除索引

Hive中支持的数据类型:

8fa9f934406b49c4a894133bb40a6b1b.jpg

对比内部表和外部表:

8fffe9c01c2349a7a4c27761a12ed6ea.jpg

 

  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值