hadoop
maikelsong
这个作者很懒,什么都没留下…
展开
-
大数据读书笔记(1)
1. 数据分片与路由 抽象模型为两级映射关系,第一级映射是key-partition映射,第二级映射是partition-machine映射。 数据分片有哈希分片和范围分片: 哈希分片只支持点查询,如cassandra,voltmort,membase; 范围分片支持范围查询,google的bigtable 和ms的azure; 同时支持两种的yahoo的转载 2015-11-04 18:16:42 · 438 阅读 · 0 评论 -
Hbase和solr在海量数据查询中的应用
【比如京东的交易快照,每天增量订单很多,如果存mysql肯定不合适(每天几个T的数据增长,不可维护,性能拖慢)。所以交易快照可以存到分布式文件系统里面,如hbase(保证整体容量,性能),但怎么 快速找到交易快照呢? 可以借助 solr。】---场景对于历史数据的查询,在数据规模不大的情况下,可以用传统的关系型数据库,如oracle,mysql等,可以利用他们提供的索引功能转载 2016-06-30 21:19:43 · 3007 阅读 · 0 评论 -
hadoop-hbase 关系
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。HBase是一个分布式的、面向列的开源数据库。HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。原创 2016-07-14 21:49:35 · 1178 阅读 · 0 评论