Node-js-爬虫
文章平均质量分 90
NeverSettle101
用程序改变世界!
展开
-
一起学爬虫 Node.js 爬虫篇(一)
版权声明:本文为 wintersmilesb101 -(个人独立博客– http://wintersmilesb101.online 欢迎访问)博主原创文章,未经博主允许不得转载。 一看到爬虫或者一百度爬虫,那是铺天盖地的全是 Python 爬虫啊,不得不说爬虫的框架与资料,Python 基本是最多的了,不过物极必反,Python 的爬虫有几点问题: 1.Python 对 DOM 支原创 2017-03-23 16:20:00 · 1527 阅读 · 0 评论 -
一起学爬虫 Node.js 爬虫篇(二)
版权声明:本文为 wintersmilesb101 -(个人独立博客– http://wintersmilesb101.online 欢迎访问)博主原创文章,未经博主允许不得转载。 上一篇中我们对百度首页进行了标题的爬取,本来打算这次直接对上次没有爬取到的推荐新闻进行爬取,谁知道网页加载出来没网页了,这是天要亡我大宋啊。。那我们直接去抓取网易新闻,进入网易新闻,我们要抓取的位置如下:首先来上爬取网站原创 2017-03-23 22:31:14 · 5105 阅读 · 1 评论 -
Node.js 动态网页爬取 PhantomJS 使用入门
版权声明:本文为 wintersmilesb101 -(个人独立博客– http://wintersmilesb101.online 欢迎访问)博主原创文章,未经博主允许不得转载。 既然是入门,那我们就从人类的起源。。PhantomJS 来说起吧。1、PhantomJS是什么?PhantomJS是一个基于webkit的javascript API。它使用QtWebKit作为它核心浏览器的功能,使用w原创 2017-03-24 09:34:45 · 11282 阅读 · 0 评论 -
一起学爬虫 Node.js 爬虫篇(三)使用 PhantomJS 爬取动态页面
版权声明:本文为 wintersmilesb101 -(个人独立博客– http://wintersmilesb101.online 欢迎访问)博主原创文章,未经博主允许不得转载。 今天我们来学习如何使用 PhantomJS 来抓取动态网页,至于 PhantomJS 是啥啊什么的,看这里 我们这里就不再讨论 PhantomJS 的入门基础了。下面正题今天我们来抓取网易新闻 http://news.1原创 2017-03-24 11:27:14 · 4923 阅读 · 0 评论