/**
* URL访问频率统计
* map函数 处理webpag请求和应答(URL,1)的log。
* Reduce函数 把所有相同的URL的值合并,并且输出一个成对的(URL,总个数)。
* 参考:http://labs.google.com/papers/mapreduce.html
*/
var mapReduceJob = {
map:function(/*Array*/lines){
var map_result = [];
lines.each(function(line){
var url = line.match(/GET \S+.html HTTP/);//仅简单匹配html类型链接
if(url)){
map_result.push([url[0],1]);
}
});
return map_result;
},
reduce:function(/*Array*/map_result){
var reduce_result={};
map_result.each(function(/*Array*/pair){
reduce_result[pair[0]] ||= 0;
reduce_result[pair[0]] += pair[1];
});
return reduce_result;
},
run:function(){
var xhr = new XMLHTTPRequest();
var me = this;
xhr.onreadystatechange = function(){
if (xhr.readyState == 4){
var data = xhr.responseText.split("\n");
var map_result = me.map(data);
var reduce_result = me.reduce(map_result);
console.log(reduce_result );
}
}
xhr.Open("get", "http://test.com/log/log-2009-6-7.log", true);
xhr.send(null);
}
};
mapReduceJob.run();
Map/Reduce-javascript版
最新推荐文章于 2024-07-11 16:45:00 发布