键值对存储模式

LuckyChenH

已于 2022-04-19 15:20:25 修改

阅读量1w

点赞数 6

文章标签：大数据

于 2020-07-10 09:26:59 首次发布

本文链接：https://blog.csdn.net/LuckyChenH/article/details/107243149

版权

键值对存储模式

一、键值数据库概述

键值数据库是一种非关系数据库.它使用简单的键值方法来存储数据。键值数据库将数据存储为键值对集合、其屮键作为唯一标识符。键值数据库是髙度可分区的、并且允许以其他类型的数据库无法实现的规模进行水平扩展。

键值模式、列式存储模式和文档存储模式通常被称为面向聚合的数据模型。几种模式之间可能是相互配合的，没有绝对的界限。

二、键值数据库的实现原理

Key-Value键值对数据模型实际上是一个从键到值之间的映射.即key是査找每条数据地址的唯一关键字,value是该数据实际存储的内容。例如键值：（“20091234”,“张三”），其中key为“ 20201234”是该数据的唯一入口，而value：“张三”是该数据实际存储的内容。Key-Value数据模型典型的是采用哈希函数实现关键字到值的映射,表中有一个特定的Key和一个指针指向特定的Value。通过Key来定位Value，从而进行存储和检索，实现快速查询，并支持大数据量和髙并发查询。

Key_1	Value_1
Key_2	Value_2
Key_3	Value_1
Key_4	Value_3
Key_5	Value_2
Key_6	Value_4

典型键值数据库

在键值对存储模式中，数据表中的每个实际行都具有行键（Key）和数值（Value）两个基本内容。值可以看作是一个单一的存储区域，可能是任何类型，甚至是数组。每个值都可能有不同的列名，不同键对应的值可能是完全不同的列。

本模型按照Key对数据进行快速的定位，可以通过对Key进行排序和分区操作，从而更快速的对数据定位。如果从Value入手的话，会造成资源浪费，要对全表的数据进行遍历查找。

不适用于类似关系型数据库中的关联查询，实现的代码复杂且由于数据总量过于庞大，会导致查询效率低下。不会对Value进行索引，因为值对应的列是不确定的。在经过排序后的Key即可作为第一索引

键值数据库可以划分为：

内存键值数据库和持久化键值数据库

内存键值数据库将数据保存在内存

持久化键值数据库将数据保存在磁盘

三．键值数据库的特点

1.简洁

只涉及到增加和删除操作，不需要设计复杂的数据模型，也不需要为每个属性指定数据类型。动态添加时不需要修改原有数据库的定义

2.高速

不用将数据保存在内存中，在RAM中读取和写入速度要快很多，当然也可以选择持久化。因为是存在内存中，有时需要释放来存储新的数据，最常用的算法：LRU(Least Recently Used，最久未使用算法)

3.易于缩放

可缩放性：根据系统负载量，随时添加或删除服务器

缩放的两种方式：

（1）主从式复制

主服务器处理写入请求和读取请求，并把数据复制到集群中的其他服务器里。从服务器只响应读取请求，遵从树形结构

应用情况：希望服务器能快速相应查询请求，而对写入请求响应能力没有太多要求

优点：简洁，其他服务器只需与主服务器通信，而且不用协调写入冲突

缺点：主服务器作为独木桥，一旦故障，整个集群无法处理写入请求（解决：从服务器遵守协议，若主服务器故障，一台从服务器升为主服务器）

（2）无主式复制

对于诸如网上购票这种需要大量读取和写入请求的情况，主从不适合，采用无主式复制，它遵从一种环形或网状结构

这种情况下每台服务器都可以吧自己活得新数据复制到其他服务器里面，可以指定哪几台作为它的副本存储服务器。

键值对数据库的两种读写方式

（资料来源：https://wenku.baidu.com/view/f962cb520a4c2e3f5727a5e9856a561252d321b0.html）

面向磁盘的读写方式

通常情况下，NoSQL系统中都存储着海量的数据，且无法全部维持在内存中，所以一般都采用面向磁盘的读写方式。

通常，当写入数据时候，数据会首先被写到一个内存结构中，系统返回写入成功，当内存中的数据达到指定大小或存放超过指定时限时，会被批量写入磁盘，当需要读取数据时，首先访问内存结构，如果未命中则需要访问磁盘上的实例化文件，当系统发生意外宕机时，内存结构中的数据将丢失。因此一般采用日志的方式来帮助数据进行恢复。为了进一步提高写入效率和并发能力，许多系统都采用了Append方式，即将修改和删除操作都追加写到文件末尾，而读数据时利用时间戳过滤掉旧信息，返回给用户最新版本的数据。因此，数据库需要进行定期的数据合并，将过期的冗余数据删除。

面向内存的读写方式

内存数据库将所有的数据存放在内存中。每次访问记录时，无需将数据从磁盘读到内存中，避免的磁盘操作造成的延迟。在几十年前，由于内存容量的限制，在数据库中，内存只能充当磁盘的缓存。但随着存储技术的迅猛发展，单台机器的内存容量不断增长。目前，高端的服务器已经能提供几太字节的内存容量。这使得将所有数据存在内存中成为可能。磁盘读写的操作不再是性能瓶颈，数据库系统由IO受限转向CPU受限。

五．键值对数据库的设计

1.键的设计与分区

（1）命名：有具体意义且明确，分隔符的使用（通常是":"）；如果处理与范围有关，则应把范围标识信息放入键中，Redis的键名不仅支持字符串，还支持列表、集合、有序集合、hash

（2）分区：可以按键名分区；也可以按hash分区

键最好以命名空间为前缀，这样确保了它的唯一性

可以采用实体+标识符+属性的方式，以冒号隔开

如 customer:1:name

2.值的设计

总的来说，值的设计考虑的是内存读取的时间和空间

（1）把频繁读取的值组合起来，用一个键名去读取，节省磁盘读取时间

（2）即使对于属于同一个实体的信息（大型的数据结构，嵌套结构等），最好独立出其中读取频繁的属性，节省内存空间

3.使用案例

会话存储

一个面向会话的应用程序（如 Web 应用程序）在用户登录时启动会话，并保持活动状态直到用户注销或会话超时。在此期间，应用程序将所有与会话相关的数据存储在主内存或数据库中。会话数据可能包括用户资料信息、消息、个性化数据和主题、建议、有针对性的促销和折扣。每个用户会话具有唯一的标识符。除了主键之外，任何其他键都无法查询会话数据，因此快速键值存储更适合于会话数据。一般来说，键值数据库所提供的每页开销可能比关系数据库要小。

购物车

在假日购物季，电子商务网站可能会在几秒钟内收到数十亿的订单。键值数据库可以处理大量数据扩展和极高的状态变化，同时通过分布式处理和存储为数百万并发用户提供服务。此外，键值数据库还具有内置冗余，可以处理丢失的存储节点。