nodejs提取网页内容

今天,在公司想用nodejs提取一下http://msdn.microsoft.com/zh-CN/library/windows/desktop/hh802935(v=vs.85).aspx 里面的API函数列表,做一个帮助文档。

谁知道,公司电脑上安装的是vs2005,在安装jsdom进行编译的时候一直报错,node-jquery也是一样。

晚上,回来了在自己电脑上又试了一遍,笔记本上装的是vs2013,能正常编译。

附上写的一段爬取网页代码。

var jsdom = require("jsdom");

jsdom.env("a.html",  // 这里可以使用文件系统路径,或者网页链接url
	["http://code.jquery.com/jquery.js"],
	function (errors, window) {
		var $ = window.$;
		$("table tr").each(function() {
			if ($(this).find("p").length <= 0) {
				return;
			}
			
			var tds = $(this).children("td");
			
			console.log($(tds[0]).text());
			
			var as = $(tds[1]).find("a");
			as.each(function() {
				console.log($(this).attr("href"), $(this).text());
			});
		});
	}
);


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值