目录
一.数据仓库和数据库
1.数据仓库和数据库的区别
操作型处理(数据库),叫联机事务处理OLTP(On-Line Transaction Processing),也可以称面向用户交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常进行增删改查操作。
分析型处理(数据仓库),叫联机分析处理OLAP(On-Line Analytical Processing),也可以称为
面向专业分析人员进行数据分析,通常进行查询分析操作。
2.数据仓库的分层架构
数据仓库架构可分为三层——源数据层、数据仓库层、数据应用层:
![](https://img-blog.csdnimg.cn/direct/4f24d699641c474baf18f74d327a7190.png)
二.数据库操作和数据表操作
1.数据库操作
1.创建库的语法为 CREATE DATABASE [IF NOT EXISTS] db_name [LOCATION position];
2.删除库的语法为 DROP DATABASE db_name [CASCADE];
2.数据表操作
创建数据库表的语法
3.内部表与外部表的区别
1.未被external关键字修饰的即是内部表,被external关键字修饰的即是外部表。删除外部表:仅仅是删除元数据,存储的业务数据并不会被删除,而删除内部表:直接删除元数据和存储的业务数据。
2.创建内部表的语句
create table [if not exists] 内部表名 (
字段名 字段类型, ...
)...;
创建外部表的语句
create external table [if not exists] 内部表名 (
字段名 字段类型, ...
)...;
4.查看和修改表操作
查看建表语句:show create table 表名;
查看表结构信息: desc 表名;
修改表名: alter table 旧表名 rename to 新表名;
修改表路径: alter table 表名 set location 'hdfs中存储路径';
修改表属性: alter table 表名 set tblproperties ('属性名'='属性值');
内部表转外部表
alter table stu set tblproperties('EXTERNAL'='TRUE');
外部表转内部表
alter table stu set tblproperties('EXTERNAL'='FALSE');
三.Hive映射表
流程步骤是创建表,加载数据,验证数据