学习笔记:数据库简介

✨博文作者:烟雨孤舟
💖 喜欢的可以 点赞 收藏 关注哦~~

✍️ 作者简介: 一个热爱大数据的学习者

文章目录

目录

文章目录

一、按数据的组织方式

二、按存储介质

三、按数据处理场景

四、按数据分布方式

五、数据库集群

关系型和非关系型数据库

磁盘数据库和内存数据库

OLTP数据库、OLAP数据库及HTAP数据库


数据库是一系列可以方便的访问和修改的数据的集合。

所有数据库管理系统的主要工作都是可靠的存储数据并使其对用户可用。

目前最常见的数据库模型主要是两种,即关系型数据库和非关系型数据库。

一、按数据的组织方式

数据从组织的角度上,主要分为结构化数据和非结构化数据两类。

结构化数据是带有固定结构的数据,在组织形式上是整齐格式化的,同一数据对象的所有数据都具有完全相同的结构。比如人员信息数据,定义为“身份证号、姓名、籍贯、出生日期”这种结构后,所有人员的信息都会按照这个固定的格式来组织。结构化数据是数据库中最常见的数据,也是数据库最擅长处理的数据。

非结构化数据可以理解成结构化数据之外的一切数据,这类数据无法预先定义格式,其字段类型和数量是可变。比如qq聊天发送的数据可以是图片、文字、语音等等,非结构化数据是生活中数量最庞大的数据

根据数据的组织方式,数据库可以分为结构化数据库和非结构化数据库。结构化数据库中通常会使用关系模型表达不同的结构化数据及其之间的关系,因此结构化数据库也被称为关系型数据库,对应的,非结构化数据库被称为非关系型数据库。

二、按存储介质

数据库存储和管理数据,一定离不开存储介质。从存储介质角度,数据库通常会为磁盘数据库和内存数据库两种,其中内存数据库被称为主存数据库。

磁盘数据库的数据都存储在磁盘上,具体在磁盘上的存储格式可以是文件系统、裸设备或云存储。磁盘数据库在数据的持久化保存上有明显优势。受限于硬件技术,磁盘数据库是当前的主流。

内存数据库的数据主要存储在内存中,因此有非常高的运算效率。内存数据库并非完全不使用磁盘,数据库的启动信息、初始数据等还是需要存储在磁盘上的,只是数据主要在内存中进行存储和运算。由于内存数据库的数据存储在内存中,数据库主机关机后数据会丢失,因此在数据库服务关闭前通常都需要把内存中的数据转储到磁盘上。

三、按数据处理场景

在业务上,传统的数据处理主要分为两类,一类是面向交易、产生数据的场景,业界称为“在线事务处理”场景,简称 OLTP;一类是面向分析、对既有数据进行分析利用的场景,业界称为“在线分析处理”场景,简称OLAP。对应的,分别面向这两种数据处理场景的数据库就是OLTP数据库和OLAP数据库。

OLTP数据库强调数据的强一致性和并发处理性能,这类数据库有强大的事务处理能力,适合处理事务密集型的应用场景,通常以每秒完成的事务数(TPS)来衡量数据库能力。OLTP数据库通常是以单机形式存在的,但在生产环境中往往需要部署高可用集群以保证数据库系统的可用性。

OLAP数据库强调基于海量数据的分析汇总能力,适合处理数据密集型的应用场景,通常需要数据库具备对海量数据进行随机查询、关联查询和分组统计查询的能力。OLAP数据库可以部署为单机形式,但更多的是以MPP集群的形式部署的。

HTAP数据库,通常是以“存算分离”的架构形式来同时满足OLTP和OLAP应用需要的,同时兼顾OLTP能力和OLAP能力。

四、按数据分布方式

据数据是如何被管理的,数据库可以分为集中式数据库和分布式数据库两类。

集中式数据库是数据被数据库实例集中管理的数据库类型,数据库实例可以看到和管理全部的数据。集中式数据库通常是以单机形式存在的,生产环境中往往部署为高可用集群。

布式数据库的数据是由不同实例以分布式的形式对全量数据进行管理的数据库,每个实例仅管理全量数据中的一部分(通常称为分片)。分布式数据库通常是以分布式集群的形式存在的。

五、数据库集群

数据库集群是由多个数据库实例组合在一起、以单一数据库形态对外提供数据服务的组合,在物理上通常由多个服务器组成,在逻辑上是一个数据库服务。集群中的单个数据库实例通常称为节点。数据库集群通常分为高可用集群和MPP集群。

高可用集群是以高可用为目标而构建的集群,根据高可用的实现机制,这类集群又可以分为主备集群和共享存储集群。主备集群中的节点有主次之分,集群中必须有一个主节点且只能有一个主节点,但可以有一到多个备节点。共享存储集群的节点可以有主次之分,也可以完全对等,由集群的具体的实现技术决定。

MPP集群是为应对基于海量数据的存储和管理需要而构建的集群,这类集群中有多个计算节点,可能有一个或一组管理节点,也可能没有管理节点。

关系型和非关系型数据库

关系型数据库模型是将复杂的数据结构用较为简单的二元关系(二维表)来表示。在该类型数据库中,对数据的操作基本上都建立在一个或多个表格上,我们可以采用结构化查询语言(SQL)对数据库进行操作。关系型数据库(RDBMS)目前主流的数据可技术。具有代表性的数据库管理系统有:Oracle、DB2、SQL Server、MySQL等。
简记:关系 = 二维表
关系型数据库都是把数据保存在硬盘上,不会随着关机而丢失数据
非关系型数据库(NoSql)
    Redis           键值存储数据库
    Mongo db        文档数据库
    Hbase           列存储数据库
    Column-oriented 列存储数据库
    Neo4J           图形数据库
非关系型数据库是把数据保存在内存中,电脑一旦关机数据也会丢失。
非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对等.存储数据的格式可以是key,value形式、文档形式、图片形式等等

磁盘数据库和内存数据库

磁盘数据库需要频繁地访问磁盘来进行数据的操作,处理速度较慢
典型的磁盘数据库就是最常用的 Oracle,Mysql,Mongodb、postgresql等。
 内存数据库数据处理速度比传统数据库的数据处理速度要快很多
 常用内存数据库Redis

OLTP数据库、OLAP数据库及HTAP数据库

联机分析处理OLAP,系统强调数据分析
OLAP的特点:
    实时性要求不高。
    数据量大,例如时间序列分析等,处理的数据量很大。
    决策支持,查询一般是动态的,也就是说允许用户随时提出查询的要求
联机事务处理OLTP也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLTP的特点:
    实时性要求高;
    数据量不是很大;
    交易一般是确定的,所以OLTP是对确定性的数据进行存取;
    并发性要求高并且严格的要求事务的完整,安全性。
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

烟雨孤舟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值