数仓和数据库的区别:
数仓通常指的是数据仓库(Data Warehouse),而数据库(Database)则指传统的关系型数据库等。数仓即数据仓库,主要用于支持企业的业务分析和决策,它面向的是分析处理,也被称为联机分析处理(OLAP)。数藏是为了解决企业大量历史数据的存储、管理和分析问题而设计的,它能够提供直观且易于理解的查询结果,侧重于决策支持。数据库传统的关系型数据库主要应用于基本的、日常的事务处理,例如银行交易,这称为联机事务处理(OLTP)。数据库针对具体业务在联机的日常操作中进行增删改查操作,是面向用户交易的处理系统。
总的来说,数仓和数据库都是数据处理的重要工具,但它们的设计目标和适用场景存在显著差异。数藏专注于为数据分析和战略决策提供支持,而数据库则专注于高效的事务处理和日常业务操作。在企业运营中,两者相辅相成,共同支撑企业的信息化需求。
数据库操作:
创建数据库
desc database myhive;
查看数据库详细信息
create database if not exists myhive;
use myhive;
创建数据库并指定hdfs存储位置
create database myhive2 location '/myhive2';//使用location关键字,可以指定数据库在HDFS的存储路径。
删除一个空数据库,如果数据库下面有数据表,那么就会报错
drop database myhive;
强制删除数据库,包含数据库下面的表一起删除
drop database myhive2 cascade;
内部表和外部表:
查看表操作:
查看所有表
show tables;
查看建表语句
show create table 表名;
查看表结构信息
desc 表名;
查看表格式化信息
desc formatted 表名;
修改表名
alter table 旧表名 rename to 新表名;
修改表路径
alter table 表名 set location 'hdfs 中存储路径';
修改表属性
alter table 表名 set tblproperties ('属性名'='属性值');