Google放弃MapReduce ?

historyasamirror

于 2010-09-24 10:52:00 发布

阅读量6.2k

点赞数

分类专栏：分布式系统（Distributed System）文章标签： mapreduce google database processing web 搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/historyasamirror/article/details/5902957

版权

分布式系统（Distributed System）专栏收录该内容

11 篇文章 2 订阅

订阅专栏

前两天CSDN的大标题有些吓人“google 放弃MapReduce”。
我找到原文浏览一番，其实并不是google不用MapReduce了，而是google在web indexing中已经放弃了MapReduce。
看起来很意外，其实大势所趋。
MapReduce说到底是一个batch processing system（批处理系统），“you can't start your next phase of operations until you finish the first”。也就是说，在用MapReduce做web index的过程中，是不能够对这个index做更新的。这就会有一个问题，通过MapReduce产生的index很难包括那些最新的web数据。而现在搜索引擎一个很重要的衡量指标就是它能够进行real-time search，即能够找到互联网上最新发布的网页和数据。很难通过MapReduce来实现这个目标。
所以，google放弃了MapReduce这个架构，而转而采用另一个类似于“database programming model”的模型，在这个模型中，只需要直接修改存储在bigTable中的web数据就可以更新它的index，其实类似于Database中的trigger。这样，最新抓取到的数据能够立刻反映到index中，也就能够体现到用户的搜索结果当中。
Google貌似已经在今年的OSDI上提交了关于这个系统的paper，乐观的话下个月就能够了解到系统设计的细节了。

引文： http://www.theregister.co.uk/2010/09/09/google_caffeine_explained/

-- END --

historyasamirror

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Google放弃MapReduce ?

<br />前两天CSDN的大标题有些吓人“google 放弃MapReduce”。<br />我找到原文浏览一番，其实并不是google不用MapReduce了，而是google在web indexing中已经放弃了MapReduce。<br />看起来很意外，其实大势所趋。<br />MapReduce说到底是一个batch processing system（批处理系统），“you can't start your next phase of operations until you fi
复制链接

扫一扫

专栏目录

historyasamirror CSDN认证博客专家 CSDN认证企业博客

码龄18年

95: 原创

39万+: 周排名

84万+: 总排名

138万+: 访问

: 等级

1万+: 积分

1072: 粉丝

479: 获赞

515: 评论

765: 收藏

私信

关注

热门文章

分类专栏

最新评论

IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）
Perz_01: 很好的文章，收藏了
IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）
小号@wx:
IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）
老大，人跑了: 阻塞/非阻塞：是否需要等待所需的I/O（输入输出）存在，需要等待为阻塞。同步/异步：I/O是否完全不需要等待，不需要等待已存在的I/O从内核空间到用户空间的拷贝则为异步，需要等待为同步。阻塞、同步本质上都是等待，同步是更深层次的等待，I/O（输入输出）存在了并不表示就能马上处理I/O数据，只有等待数据到了用户空间进程才可以进行处理操作。
IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）
手磨程序: 同步和异步也可以按照提交与接收消息的顺序来区分吗，同步的话需要按照顺序进行接收，异步的话只有AIO才可以，它是内核自动提交，但是进程什么时候接收可以由进程决定
IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）
heng_zou: 有问题吧，同步说白了就是当前线程直接调用，异步则是通过其它线程调用并通过Future获取调用结果,同步和异步并不关心调用过程是否发生阻塞。异步一定是通过其它线程调用。因为回调通知一定意味着线程调用被阻塞后被唤醒回调过程。而阻塞和非阻塞则是对调用对象本身修饰。因此无论是BIO、NIO都是同步调用，区别在于NIO比起BIO多了判断IO是否准备好的再去进行IO读写，包括select/poll/epoll都是同步调用，只有AIO才是真正的异步IO，查看AIO源码发现底层还是基于线程池去执行系统调用。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。