node实现爬虫,你学会了吗?简简单单

1 篇文章 0 订阅
const http = require('http');
const cheerio = require('cheerio');//cheerio需要安装npm install cheerio
const fs = require('fs');
//要请求的地址
let urlCrawler = 'http://www.ip3q.com/e/action/ListInfo.php?&classid=90&ph=1&slx=%E4%B8%AA%E4%BA%BA%E5%8D%9A%E5%AE%A2%E6%A8%A1%E6%9D%BF';

//请求地址
http.get(urlCrawler, (res) => {
    let crawlerHtml = '';
    //防止乱码
    res.setEncoding('utf-8');
    //接收数据过程中拼接数据
    res.on('data', (item) => {
            crawlerHtml += item
        })
        //接收完成后进行的操作
    res.on('end', () => {
        let files = [];
        // console.log(crawlerHtml)
        const $ = cheerio.load(crawlerHtml);
        //找到需要爬取的片段
        $('.pics-list-price ul li').each((index, value) => {
            //找到标题
            let title = $(value).find('h2').text();
            let list = {
                    title
                }
                //放到数组中
            files.push(list)
        });
        //放入文件 如果没有则生成该文件
        fs.appendFileSync('./hellow.json', JSON.stringify(files, "", '\t'))
    })
})
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值