开源中国上看到有人写过Node JS版本的看糗百,然而现在用不了了,话说本身用JQuery解析就有点问题,所以自己写了一个。
网络爬虫用的nodegrass,解析用的原生JS
原帖 http://www.oschina.net/code/snippet_191191_24956
var nodegrass = require("nodegrass")
nodegrass.get('http://www.qiushibaike.com', function(data,status,headers){var count=0;
var timer=setInterval(function(){
var index0=data.indexOf('糗友:');
var index1=data.indexOf('<br/><br/>');
if(index0==-1||index1==-1){
clearInterval(timer);
}
else{
console.log(count++);
console.log();
var author=data.substring(index0+3,index1);
data=data.substring(index1+10,data.length);
var content=data.substring(0,data.indexOf('<img')).replace(/<br\/>/g,'');
console.log("作者:" + (format(author) || "匿名"));
console.log("内容:" + format(content) + "\n\n");
}
},2000)
},'utf8').on('error', function(e){
console.log('Got error:'+e);
});
function format(content){
return content.replace(/\n/g, "");
}
https://tonicdev.com/npm/jQuery 在线NodeJS,亲测可用