Day3:Hive实操

目录

一、数据库与数据仓库的区别

二、数据仓库

        1.数据仓库诞生的原因

        2.数据仓库的基本概念

        3.数据仓库的主要特征

        4.数据仓库分层架构

三、数据库的操作


一、数据库与数据仓库的区别

数据库:数据库是面向交易的处理系统(业务系统),它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理,也被称为联机事务处理 OLTP(On-Line Transaction Processing)。

数据仓库::数据仓库一般针对某些主题的历史数据进行分析,支持管理决策,又被称为联机分析处理 OLAP(On-Line Analytical Processing)。

数据仓库VS数据库

  1. 数据库是面向事务的设计,数据仓库是面向主题设计的。
  2. 数据库一般存储业务数据,数据仓库存储的一般是历史数据。
  3. 数据库设计是尽量避免冗余,一般针对某一业务应用进行设计,比如一张简单的User表,记录用户名、密码等简单数据即可,符合业务应用,但是不符合分析。数据仓库在设计是有意引入冗余,依照分析需求,分析维度、分析指标进行设计。
  4. 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

二、数据仓库

1.数据仓库诞生的原因        

  • 历史数据积存:历史数据使用频率过低,堆积在业务数据库中,会导致查询性能下降
  • 企业数据分析需要:各个部门自己建立独立的数据抽取系统,导致数据不一致,资源 浪费严重,数据库权限也会存在风险

2.数据仓库的基本概念

     数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。

3.数据仓库的主要特征

   

   1)面向主题的(Subject-Oriented)

   不同于传统数据库对应于某一个或多个项目,数据仓库根据使用者实际需求,将不同数据源   的数据在一个较高的抽象层次上做整合,所有数据都围绕某一主题来组织。

    2)集成性(Integrated)

    数据仓库中存储的数据是来源于多个数据源的集成,原始数据来自不同的数据源,存储方式各不相同。要整合成为最终的数据集合,需要从数据源经过一系列抽取、清洗、转换的过程。

    3)稳定性(Non-Volatile)

    数据仓库中保存的数据是一系列历史快照,不允许被修改。用户只能通过分析工具进行查询和分析。这里说明一点,数据仓库基本上是不许允许用户进行修改,删除操作的。大多数的场景是用来查询分析数据。

    4)时变性(Time-Variant)

    数据仓库会定期接收新的集成数据,反应出最新的数据变化。这和稳定特点并不矛盾。

4.数据仓库分层架构

按照数据流入流出的过程,数据仓库架构可分为三层——源数据数据仓库数据应用。

源数据层(ODS):此层数据无任何更改,直接沿用外围系统数据结构和数据,
不对外开放;为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做
准备。
数据仓库层(DW):也称为细节层,DW层的数据应该是一致的、准确的、干
净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。
数据应用层(DA或APP):前端应用直接读取的数据源;根据报表、专题分析
需求而计算生成的数据。

三、数据库的操作

1、创建一个指定名字的数据库

create database db_1;

2、创建一个指定字符集的数据库

create database db_2 charset utf8MB4;

3、创建一个指定校对集的数据库

create database db_3 charset utf8MB4 collate utf8mb4_general_ci;

4、显示所有数据库

show databases;
5、使用数据库

使用数据库指在进行具体SQL指令之前,让系统知道操作针对的是哪个数据库

  • 数据库的操作通常是针对数据表或者数据
  • 通过使用数据库可以让后续指令默认针对具体数据库环境
  • 使用数据库语法:use 数据库名字;
use db_1;
6、删除数据库

将当前已有数据库删除

  • 删除数据库会删除数据库内所有的表和数据
  • 删除数据库操作要慎重(删前备份)
  • 删除数据库后,对应的存储文件夹就会消失
  • 删除语法
    drop database 数据库名字;
drop database db_1;

四、创建数据表

1、创建简单数据表(指定数据库创建数据表)

create table db_2.t_1(
	name varchar(50)
);

待补充……

  • 22
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值