key-value数据库的一种实现

最新推荐文章于 2023-03-23 10:50:26 发布

turkeyzhou

最新推荐文章于 2023-03-23 10:50:26 发布

阅读量5.5k

点赞数 1

分类专栏： scalable/loadbalance 文章标签：数据库存储 exception null 存储系统 web

本文链接：https://blog.csdn.net/turkeyzhou/article/details/6024395

版权

scalable/loadbalance 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

关于KV存储

什么是NOSQL

NoSQL，指的是非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。

Key_value数据库的物理组成

存储系统主要由索引文件(.idx)和存储文件(.mmap)组成，索引文件主要存储的是具体数据的索引元信息，帮助快速定位数据在mmap存储文件中的位置。

数据块的划分

数据文件和索引文件都以文件映射的方式映射到内存中。文件被划分为几个大块，每个大块的长度都是Integer.maxValue,每个大块又被多个block组成。

这样划分数据块的好处很明显，要在物理文件中定位数据很容易，只要知道block的index，则可以很快的利用除数找到数据所在的大块，然后用余数找到数据在大块中的偏移位置。

索引文件的存储

其中，base_info中主要存储的是以下数据：

isInit：是否已经初始化

bucketCount：桶的数量

collisionCount：备用的索引块的数量

freeBlockIdx：空间块索引

recordCount：记录的数量

storeType：存储类型

minCellSize：最小单元格尺寸

其中extinfo主要存储表的定义信息

collisionPool是当bucketpool不够用的时候做备用

数据文件的格式如下

每个物理存储单元都存在一个指针，指向下一个单元，可养可以避免分配空间的时候必须分配成块的空间，也在空间回收的时候，避免了内存碎片无法使用的情况，其中元信息中含有空间的数据block空间的头和尾，用于在存储数据的时候，按照数据的size分派空间，并将此空间从队列出去除。

下面以数据的增删改查作为场景，分析一下:

l 新增数据：

1）查找索引

this.index.get(hashCode);

根据Key的hashcode对bucketCount取余，然后定位到大块，然后对大块的buckCount取模，得到索引Block在大块中的偏移量。

int bigBlockNum = idx / this.bigBlockMaxCount;//计算块落在哪个大块中 if(bigBlockNum >= this.buffers.length) {//超出范围 return null; } int innerIdx = idx % this.bigBlockMaxCount;//计算块在大块内的下标 ByteBuffer tmpBuffer = this.buffers[bigBlockNum].duplicate(); //System.out.println("old limit:"+ tmpBuffer.limit() +" cap:"+ tmpBuffer.capacity()); tmpBuffer.position(blockSize * innerIdx); tmpBuffer.limit(blockSize * (innerIdx + 1)); return tmpBuffer.slice();

2）判断索引块的几个同义词(hashCode%buckCount相等)是否存在该key的位置。

for(int i = 0; i < BLOCK_CELL; i++) { if(hasData(i)) { if(getId(i) == id) { int[] info = new int[INDEX_INFO_COUNT - 1]; for (int j = 0; j < info.length; j++) { info[j] = this.buff.get(i * INDEX_INFO_COUNT + j + 2); } return info; } continue; } else { return null; } } int next = getNext(); if(next > 0) { return getCollisionBlock(next).read(id); } else { return null; }

3）存储数据。

3.1）新增数据，从空闲链表空间中分配空间。

public BlockChain allocateFreeChain(int needBlockCount) throws Exception { if(needBlockCount <= 0) { throw new RuntimeException("[allocateFreeChain]Allocate block count can not <= 0,"+ needBlockCount); } freeChainLock.lock(); int count = 0; try { Block b = null; int n = 1; //取得空闲链头 int head = getHead(); int blockIdx = head; for(;;) { b = getBlock(blockIdx); boolean hasNext = (getTail() != blockIdx); if(!hasNext) {//已没有足够的空闲链,扩展空闲链 int freeBeginIdx = pool.getBlockCount(); pool.extend(extendCount); int freeEndIdx = pool.getBlockCount(); initFreeChain(freeBeginIdx, freeEndIdx); //加到空闲链中 b.next(freeBeginIdx); setTail(freeEndIdx - 1); setBlockCount(freeEndIdx); } blockIdx = b.next(); count++; if(n == needBlockCount) {//已找到足够大的空闲链 setHead(blockIdx); //截断刚分配的空闲链 b.setTail(); return new BlockChain(this, head); } n++; } } finally { freeChainLock.unlock(); } }

从空闲空间block的头开始遍历，知道找到能够容纳的他的空间。用block链表的形式返回，并且更新余下的空闲的block指针。

3.3)修改数据，数据长度变短。

如果数据长度简短，则覆盖数据后，必须将剩下多出来的block重新添加到空闲block队列后，改变指针即可做到。

3.3)修改数据，数据长度变长。

计算需要增加的block空间，从空闲block队列的得到，并且append在已有数据的block队列中即可。

4)更新索引

将索引的ID，数据block的头指针，数据的block个数等写入索引文件中相应的位置，并且更新索引快的Info标志。