- 博客(2)
- 收藏
- 关注
转载 mapreduce提高性能的七点建议
Cloudera提供给客户的服务内容之一就是调整和优化MapReduce job执行性能。MapReduce和HDFS组成一个复杂的分布式系统,并且它们运行着各式各样用户的代码,这样导致没有一个快速有效的规则来实现优化代码性能的目的。在我看来,调整cluster或job的运行更像一个医生对待病人一样,找出关键的“症状”,对于不同的症状有不同的诊断和处理方式。 在医学领域,没
2015-07-10 11:59:04 527
转载 海量数据处理算法—Bloom Filter
filter算法vectorfunctionurlfile 目录(?)[-] 1 Bloom-Filter算法简介2 Bloom-Filter的基本思想3 扩展 CounterBloom Filter CounterBloom FilterCompressed Bloom Filter 4 Bloom-Filter的应用 网络应用垃圾邮件地址过滤 5 Blo
2015-07-03 00:33:39 390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人