HBase使用场景
Hbase是一个通过廉价PC机器集群来存储海量数据的分布式数据库解决方案。它比较适合的场景概括如下:
-
- 是巨量大(百T、PB级别)
- 查询简单(基于rowkey或者rowkey范围查询)
- 不涉及到复杂的关联
有几个典型的场景特别适合使用Hbase来存储:
-
- 海量订单流水数据(长久保存)
- 交易记录
- 数据库历史数据
如何使用HBase
三种模式:单机模式,伪分布式模式,分布式模式
一般生产环境用的是分布式模式,如果是学习的话,可以用单机模式和伪分布式模式
MongoDB特点
优点
高性能
MongoDB提供高性能的数据持久性。特别是,
对嵌入式数据模型的支持减少了数据库系统上的I / O活动。
索引支持更快的查询,并且可以包括来自嵌入式文档和数组的键。
丰富的查询语言
MongoDB支持丰富的查询语言,以支持读写操作(CRUD)以及:
资料汇总
文本搜索和地理空间查询。
SQL到MongoDB的映射图
SQL到聚合的映射图
高可用性
MongoDB的复制工具(称为副本集)提供:
自动故障转移
数据冗余。
甲副本集是一组保持相同的数据集,从而提供冗余和提高数据可用性的MongoDB服务器。
水平可伸缩性
MongoDB提供水平可伸缩性作为其核心 功能的一部分:
分片在一组计算机集群分布数据。
从3.4开始,MongoDB支持基于shard键创建数据区域。在平衡的集群中,MongoDB仅将区域覆盖的读写定向到区域内的那些分片。
支持多种存储引擎
MongoDB支持多个存储引擎:
WiredTiger存储引擎(包括对静态加密的支持 )
内存中存储引擎。
此外,MongoDB提供可插拔的存储引擎API,允许第三方为MongoDB开发存储引擎
Cassandra特点
优点
配置简单
不需要多模块协同操作。
模式灵活
使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。
真正的可扩展性
Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。
多数据中心识别
你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。
范围查询
如果你不喜欢全部的键值查询,则可以设置键的范围来查询。
列表数据结构
在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。
分布式写操作
有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
缺点
存储那种巨大的(几百T甚至P)的超大文件目前是无能为力的。