js抓取list中item的html,Nodejs HTML抓取与内容提取

来代码实在了:

var Crawler = require("crawler");

var c = new Crawler({

maxConnections : 1,

rateLimit:2000,

callback : function (error, res, done) {

if(error){

console.error(error);

}else{

var $ = res.$;

var index = 0;

var querystring = require('querystring')

var url = require('url')

var item = $('div.left-container').find('div.design-goods-list-item-contianer').each(function($this){

var a = $(this).find('.design-goods-image-container').children('a').attr('href');

var img = $(this).find('.design-goods-image-container').children('a').children('img').attr('src')

var title =$(this).find('.design-goods-image-container').children('a').children('img').attr('title')

var price = $(this).find('.design-goods-price-and-collect-container').children('div.design-goods-price').text()

//var ref = a.attr('href')

//var img = a.children('img').attr('src')

var argstr = url.parse('http://gz.17zwd.com'+a).query

var arg = querystring.parse(argstr);

console.log('GID='+arg.GID)

console.log(a)

console.log(img)

console.log(title)

console.log(price)

console.log('------------')

console.log()

});

}

done();

}

});

c.queue({

uri:"http://gz.17zwd.com/sks.htm?pstart=80&pend=89&ax=&zdid=42&mid=-1&fid=-1&cateid=50010850&color=&size=&so=2017+春&page=2",

});

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值