排序:
默认
按更新时间
按访问量

MapReduce 算法设计-Inverted Indexing

倒排索引是搜索引擎中不可或缺的数据结构,利用倒排索引可以快速搜索到包涵搜索关键词的一系列文章。 在倒排索引中,每个term与一系列的postings相关联,每个postings由文章的id以及payload组成,而payload常见的是该词在该文章中的词频,有的也加上了位置信息

2016-02-25 10:46:52

阅读数:363

评论数:0

MapReduce算法设计-Second Sorting

二次排序在MapReduce算法编写的另一个技巧,MapReduce在处理完数据后,智能保证数据是按key排序的,但每个key对应的值(假如有多个)不能保证也是有序的,这就需要一种特别的技巧-Second Sorting,用来保证值的有序性。

2016-01-20 10:54:02

阅读数:307

评论数:0

MapReduce算法设计-计算单词共现矩阵

利用MapReduce计算单词共现矩阵

2016-01-10 13:00:35

阅读数:1553

评论数:0

MapReduce 算法设计-Local Aggregation

MapReduce 算法设计-Local Aggregation本文主要内容来自由马里兰大学的Jimmy Lin 和 Chris Dyer写的《Data-Intensive Text Processing with MapReduce》一书中的第三章,如有错误,欢迎指正。 更新说明:我发现已经有...

2015-12-21 09:19:58

阅读数:564

评论数:0

基于Xen的PV Guest VM与HVM性能比较

基于Xen的PV Guest VM与HVM性能比较1 半虚拟化与全虚拟化的区别 Xen Paravirtualization (PV) 半虚拟化技术不需要物理机CPU含有虚拟化扩展,是完全基于软件模拟实现的虚拟化.但其需要修改操作系统,需要操作系统的支持,这限制了其扩展性,即不能支持不开源的操作...

2015-04-25 22:49:36

阅读数:859

评论数:0

Ubantu安装xen4.4虚拟机

Ubantu安装Xen4.4

2015-04-04 19:33:24

阅读数:741

评论数:1

Xen虚拟机安装Windows8

Xen虚拟机安装Windows8本文主要讲解在xen环境下如何安装Windows8系统虚拟机.

2015-04-04 16:36:20

阅读数:2250

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭