nodejs 简易爬虫

最新推荐文章于 2024-05-14 08:21:54 发布

「已注销」

最新推荐文章于 2024-05-14 08:21:54 发布

阅读量191

点赞数

分类专栏：爬虫 js 文章标签： nodejs 爬虫

本文链接：https://blog.csdn.net/ghostyusheng/article/details/84331849

版权

js 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

爬虫

2 篇文章 0 订阅

订阅专栏

用nodejs编写爬虫跟其他语言一样，比较简单，比较各个语言标准库都差不多，主要就是抓取页面，然后分析dom节点，获取数据。

requests 经典的请求库，cherrio 像jquery一样解析dom的库。
这里用csdn举例。

var request = require('request');
var promise = require('bluebird');
const cheerio = require('cheerio');
const baseUrl = "https://blog.csdn.net/ghostyusheng/article/list/";

function startReq(url) {
    return new Promise(function (resolve, reject) {
       let titles = []; 

        request(url, function (error, response, body) {
            const $ = cheerio.load(body);
            const data = $('h4 > a');
            
            data.map((k) => {
                const title = data[k].children[0].next.next.data;
                titles.push(title);
            })

            resolve(titles);
        });

    });
}

for (let i = 1; i < 10; i++) {
    const url = baseUrl + i;
    promise
        .all(startReq(url))
        .then(function(titles) {
            console.log('scrawl complate!', titles);
        })
}

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nodejs 简易爬虫

用nodejs编写爬虫跟其他语言一样，比较简单，比较各个语言标准库都差不多，主要就是抓取页面，然后分析dom节点，获取数据。requests 经典的请求库，cherrio 像jquery一样解析dom的库。这里用csdn举例。var request = require('request');var promise = require('bluebird');const cheeri...
复制链接

扫一扫