自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小小八卦姐的专栏

大数据 分布式 数据库

  • 博客(11)
  • 收藏
  • 关注

转载 NoSQL数据库的分布式算法

本文另一地址请见NoSQL数据库的分布式算法本文译自 Distributed Algorithms in NoSQL Databases系统的可扩展性是推动NoSQL运动发展的的主要理由,包含了分布式系统协调,故障转移,资源管理和许多其他特性。这么讲使得NoSQL听起来像是一个大筐,什么都能塞进去。尽管NoSQL运动并没有给分布式数据处理带来根本性的技术变革,但是依然引发了铺天盖地

2014-10-05 12:49:54 709

转载 MySQL索引背后的数据结构及算法原理

摘要本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注于BTree索引,因为这是平常使用MySQL时主要打交道的索引,至于哈希索引和全文索引本文暂不讨论。文章主要内容分为三个部分

2014-10-05 12:44:14 530

转载 MapReduce 算法 —— 二级排序

英文原文:MapReduce Algorithms – Secondary Sorting

2014-10-05 12:09:44 1011

转载 MapReduce算法 – 反转排序(Order Inversion)

本文译自 MapReduce Algorithms – Order Inversion译者注:在刚开始翻译的时候,我将Order Inversion按照字面意思翻译成“反序”或者“倒序”,但是翻译完整篇文章之后,我感觉到,将Order Inversion翻译成反序模式是不恰当的,根据本文的内容,很显然,Inversion并非是将顺序倒排的意思,而是如同Spring的IOC一样,表明的是一种

2014-10-05 12:05:30 1772

转载 用 Hadoop 计算共生矩阵

本文译自Calculating A Co-Occurrence Matrix with Hadoop本文是《Data-Intensive Text Processing with MapReduce》提到的MapReduce算法的系列文章的延续。这次我们会使用语料库建立一个单词共生矩阵。所谓共生矩阵可以描述为对于某种事件,给予一个特定的时间或者空间限制,然后记录在这种情况下会发生的

2014-10-05 12:04:34 940

转载 用MapReduce进行数据密集型文本处理 – 本地聚合(下)

本文译自 Working Through Data-Intensive Text Processing with MapReduce – Local Aggregation Part II本文是《Data Intensive Processing with MapReduce》中的算法实现系列文章的最新一篇。在第一篇里,我们讨论了使用本地聚合技术来减少shuffle阶段的网络传输数据量

2014-10-05 12:03:10 896

转载 用MapReduce进行数据密集型文本处理 – 本地聚合(上)

本文译自Working Through Data-Intensive Text Processing with MapReduce因为最近忙于Coursera提供 的一些课程,我已经有一段时间没有写博客了。这些课程非常有意思,值得一看。我买了一本书《Data-Intensive Processing with MapReduce》,作者是Jimmy和Chris Dyer。书里以伪码形式

2014-10-05 11:58:45 1272

转载 MapReduce的常用算法

本系列文章翻译自博客codingjunkie.net , 作者总结了在《Data-Intensive Processing with MapReduce》这本书中涉及到的处理数据的方法,并写了真实可用的hadoop样例代码来代替书中的伪码。遗憾的是这本书目前在国内还买不到,只能从Amazon.com上购买。本系列文章包括用MapReduce进行数据密集型文本处理 – 本地聚合(

2014-10-05 11:57:36 1434

转载 MySQL事务隔离级别详解

转载于:http://xm-king.iteye.com/blog/770721

2014-10-05 11:17:59 446

转载 分布式系统

分布式系统从当初的CORBA 到EJB,Web和SOA,从集群到现在的NoSQL 云计算和大数据Hadoop等分布式系统,横向水平扩展Scala out/in是分布式系统设计的一个特点,可靠性 容错性是两个质量指标。  什么是分布式系统?  一大批服务器组成一个集合,对于用户来说仍然是一个整体连贯系统。  A. Tanenbaum定义:分布式网络的计算机中的组件之间

2014-10-03 22:14:00 716

转载 浅析Sql server锁,独占锁,共享锁,更新锁,乐观锁,悲观锁

锁有两种分类方法。(1) 从数据库系统的角度来看锁分为以下三种类型: •独占锁(Exclusive Lock)独占锁锁定的资源只允许进行锁定操作的程序使用,其它任何对它的操作均不会被接受。执行数据更新命令,即INSERT、 UPDATE 或DELETE 命令时,SQL Server 会自动使用独占锁。但当对象上有其它锁存在时,无法对其加独占锁。独占锁一直到事务结束才能被释放。

2014-10-03 21:59:33 855

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除