大数据时代常用的几类Key-Value(NoSQL)数据库

在过去的十年中,计算世界已经改变。现在不仅在大公司,甚至一些小公司也积累了TB量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。 

一个解决方案是使用键值(Key-Value)存储数据库,这是一种NoSQL(非关系型数据库)模型,其数据按照键值对的形式进行组织、索引和存储。KV存储非常适合不涉及过多数据关系业务关系的业务数据,同时能有效减少读写磁盘的次数,比SQL数据库存储拥有更好的读写性能。 

本文就为你介绍9种用于大数据处理的免费键值存储数据库。

 

1. Aerospike 社区版

Aerospike是一个以分布式为核心基础,可基于行随机存取内存中索引、数据或SSD存储中数据的数据库。 
Aerospike主要用于广告业务,作为一个服务器端的cookie存储来使用,在这种场景下读取和写入性能是至关重要的。 
 

2. LevelDB

Leveldb是Google开发的一个非常高效的kv数据库,支持billion级别的数据量,在这个数量级别下还有着非常高的性能,主要归功于它的良好的设计,特别是LSM算法。Leveldb已经作为存储引擎被Riak和Kyoto Tycoon所支持,在国内淘宝的Tair开源key-value存储也已经将LevelDB作为其持久化存储引擎,并部署在线上使用。 
 

3. RocksDB

RocksDB是一个可嵌入的持久的Key-Value存储。

 

*leveldb和rocksdb性能对比

测试一:将1B(即10亿)个key数据随机批量写入空数据库

rocksdb:   103 minutes, 80 MB/sec (total data size 481 GB, 1 billion key-values)
leveldb:   many many days (in 20 hours it inserted only 200 million key-values)

原因:

rocksdb其实使用了两步:先做fillrandom,再做compact

leveldb只是使用了一步:fillrandom

测试二:将1B个key数据顺序批量插入空数据库

rocksdb:   36 minutes, 370 MB/sec (total data size 760 GB)
leveldb:   91 minutes, 146 MB/sec (total data size 760 GB)
Java
fillseq : 2.48233 micros/op; 311.2 MB/s; 1000000000 ops done; 1 / 1 task(s) finished.

原因:

rocksdb使用了多线程compact

测试三:随机覆盖1B个key数据

rocksdb: 15 hours 38 min;  56.295 micros/op, 17K ops/sec,  13.8 MB/sec
leveldb: many many days;  600 micros/op,     1.6K ops/sec, 1.3 MB/sec
          (in 5 days it overwrote only 662 million out of 1 billion keys, after which I killed the test)

原因:

rocksdb使用了20个compact线程,使用了6个level,仅了level 2及以上启用了gzip

测试四:随机读取1B个key数据

rocksdb:  70 hours,  8 micros/op, 126K ops/sec (checksum verification)
leveldb: 102 hours, 12 micros/op,  83K ops/sec (no checksum verification)
Java:
readrandom : 7.67180 micros/op; 101.4 MB/s; 1000000000 / 1000000000 found; 32 / 32 task(s) finished.

配置:rocksdb额外启用了checksum,leveldb关闭了checksum

原因:rocksdb没有用mmaped IOs,这个在某些linux平台上会慢。rocksdb把block cache分成了64份,以降低锁力度。

测试五:多线程读,同时单线程写

rocksdb: 11 hours 30 minutes, 9.640 micros/read, 103734 reads/sec
leveldb: 20 hours 28 minutes

Java:

readwhilewriting :     9.55882 micros/op;   81.4 MB/s; 100000000 / 100000000 found;  32 / 32 task(s) finished.

配置:rocksdb release 2.7 and leveldb 1.15

PS: RocksDB的配置,见官网:https://github.com/facebook/rocksdb/wiki/RocksDB-Tuning-Guide

中文参考:http://www.jianshu.com/p/ddf652aa4882

 

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Key-Value数据库是一种NoSQL(非关系型数据库)模型,数据按照键值对的形式进行组织、索引和存储。它在处理大数据时有很多优势,并且被广泛应用于不同的系统和场景。以下是一些常见的Key-Value数据库: 1. RocksDBRocksDB是一个高性能、可嵌入的Key-Value存储引擎,适用于各种应用场景。它具有快速的写入和读取速度,并且可以处理大量的数据。 2. LevelDB:LevelDB是Google开发的一个持久化键值存储库,具有高性能和可靠性。它支持快速的写入和读取操作,并且能够处理大规模的数据集。 3. Memcached:Memcached是一种分布式内存对象缓存系统,常用于缓存常用的查询结果集或其他需要频繁读取的数据。它可以提供快速的数据访问速度,并且具有高可扩展性。 4. Redis:Redis是一个高性能的内存键值数据库,支持各种数据结构和功能。它可以用作缓存、消息队列、分布式锁等,具有快速的读写操作和高可用性。 5. DynamoDB:DynamoDB是亚马逊AWS提供的一种高度可扩展的NoSQL数据库服务,适用于处理大规模数据和高并发访问。 6. Riak:Riak是一种分布式键值数据库,具有高可用性和可扩展性。它适用于存储大量的松散关联的数据,并且可以在多个节点上进行分布式存储和处理。 7. Couchbase:Couchbase是一个面向文档的NoSQL数据库,支持键值和文档数据模型。它具有高性能、可扩展性和灵活性,适用于各种应用场景。 8. MongoDB:MongoDB是一个面向文档的NoSQL数据库,支持键值和文档数据模型。它具有灵活的数据模型和丰富的查询功能,适用于复杂的数据结构和大规模的数据存储。 9. Cassandra:Cassandra是一种高度可扩展的分布式键值数据库,具有强大的数据复制和容错性能。它适用于需要高可用性和可扩展性的大规模数据存储。 这些都是一些常见的Key-Value数据库,它们在不同的场景和需求中都有各自的优势和适用性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [大数据时代常用几类Key-Value(NoSQL)数据库](https://blog.csdn.net/gunri_tianjin/article/details/83215422)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [RebornDB:下一代分布式Key-Value数据库](https://download.csdn.net/download/weixin_38656462/14959009)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值