超级简单的js爬虫,在浏览器按F12后进入前端后台console,将以下代码粘贴并执行,即可返回结果。
clear();
//信息块
var formatedText="";
var blocks = document.querySelectorAll("#rightContent > div.grid-right > div > ul > li > div");
for(i in blocks){
try{
//遍历信息块
var itemNumber=blocks[i].childNodes[3].childNodes[1].childNodes[1].innerText;
//标题文字和链接
var titleText = blocks[i].childNodes[3].childNodes[1].childNodes[5].innerText;
var titleHref = blocks[i].childNodes[3].childNodes[1].childNodes[5].href;
//时效性信息
var timeInfo = blocks[i].childNodes[5].innerText;
formatedText+=itemNumber+"$$$"+titleText+"$$$"+timeInfo+"$$$"+titleHref+"$$$$$$";
//console.log(titleText);
//console.log(titleHref);
//console.log(timeInfo);
//console.log(i);
}catch(err){
break;
}
}
console.log(formatedText);