一个【nodejs】结合【electron】或【nwjs】的爬虫的新思路

无意浏览到网上的一个问答,受到启发,记录下来。


***************************************************************************************************************

传统的爬虫是利用一些库模拟http请求,获取响应后,把接收到的“页面”用正则之类的技术,抽取有用信息。

***************************************************************************************************************


问题是我们直接用浏览器多好!!可是普通的浏览器没有强大的系统api支持,归根到底就是没有强大的js本地调用能力。什么技术有呢?对!是nodejs!!


有个集成nodejs环境的浏览器多好!


有吗?


******************************************

当然有!而且有两个ElectronNWJS

******************************************

集成浏览器有什么好处??


前端开发用“选择器”来操作dom,这样你就可以用jQuery之类的东东来抽取dom,然后利用nodejs分析处理或交给其他异构系统处理。


以上说法都是思路,可行性还不知道。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值