正西风落叶下长安

π seconds equal to one nano-century.

浅析Merkle Tree——分布式系统数据校验的基石

什么是Merkle Tree Merkle Tree是一种基于哈希的数据结构。Merkle Tree是一种树状数据结构,该树中的每一个叶子结点都是一个数据块,而每一个非叶子结点都是其子结点组合的哈希。普遍性况下Merkle Tree是二叉树,也就是说Merkle Tree中的每一个结点有两个子结...

2018-04-07 13:21:16

阅读数 633

评论数 0

详解Cassandra数据模型中的primary key

Primary key的基本使用方法 Primary key的基本使用方法同关系型数据库中的primary key基本相同,既用来作为某一行数据的主键。我们用一个最基本的Cassandra表来作为例子。这种最基本的表可以被称为“静态表”。示例如下: CREATE TABLE users (...

2017-08-21 07:27:48

阅读数 2456

评论数 0

深入理解HBase的系统架构

HBase的构成 Regions HBase的HMaster ZooKeeper HBase各组成部分之间的合作 HBase的第一次读写 HBase的META table Region Server的组成 HBase的写操作步骤 步骤一 步骤二 HBase的MemStore HBase R...

2017-06-07 17:34:16

阅读数 14181

评论数 7

浅析HBase:为高效的可扩展大规模分布式系统而生

什么是HBase 关系型数据库与HBase的对比 关系型数据库的局限性 HBase的高效,分布式,可扩展性的设计理念 HBase的数据模型 什么是HBase Apache HBase是运行在Hadoop集群上的数据库。为了实现更好的可扩展性(scalability),HBas...

2017-06-01 14:20:25

阅读数 2918

评论数 1

Spark流处理中的DStrem.foreachRDD()方法

Spark数据处理 Spark作为分布式数据处理的一个开源框架,因其计算的高效性和简洁的API而广受欢迎。一般来说,Spark大部分时候被用来进行批处理。但现在Spark通过其SparkStreaming模块也实现了一定的流处理的功能。 Spark流处理的过程 Spark中的流处理实际上...

2017-05-14 10:30:07

阅读数 2078

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭