cheerio爬取网页数据,存储到MySQL数据库

最近在做物流项目成本分析,需要爬取柴油价格数据,使用到了cheerio,cheerio实现了jQuery核心的一个子集。以下为爬取代码。

//getHtml.js,获取HTML页面数据
var http = require("http");

function gethtml(url,callback){
    http.get(url,function(res){
        var data = "";
        res.on('data',function(chunk){
            data += chunk;
        });
        res.on('end',function(){
            callback(data);
        });
    }).on("error",function(){
        callback(null);
    })
}

exports.gethtml = gethtml;
//getData.js,使用cheerio获取数据并存储到mysql数据库
const cheerio = require('cheerio');
const server = require('./getHtml');

var url = 'http://ny.gold600.com/';

server.gethtml(url,function(data){
    if(data){
        var $ = cheerio.load(data);
        var data = [];
        var list = $('.oilTable tbody tr:nth-child(odd)');

        list.each(function(index,element){
            let city = $(element).find('a').text().replace(/\s/g,''); // 获取标题
            let price = $($(element).find('td')[4]).text().replace(/\s/g,''); // 获取价格
            let time = $($(element).find('td')[5]).text().replace(/\s/g,''); // 获取价格
            data.push({city,price,time})
            // console.log(price)
            // console.log(element.children('td')[0].innerTEXT);
        })
        var str = '';
        data.forEach(function(item,index){
            if(index == 0){
                str += 'VALUES("'+item.city+'",'+item.price+',"'+item.time+'")';
            }else{
                str += ',("'+item.city+'",'+item.price+',"'+item.time+'")';
            }   
        })
        console.log(str)
        var connection = mysql.createConnection({
            host:'127.0.0.1',
            user:'root',
            password:'******',
            database:'price'
        });
        console.log(str)
        connection.connect();
        connection.query('DELETE FROM priceList');
        connection.query('ALTER TABLE priceList AUTO_INCREMENT=1');
        connection.query('INSERT priceList(city,price,time) '+str,function(error,results,fields){
            if(error) throw error;
            console.log('The solution is:',results);
            let a = results[1];
            console.log(a)
        })
        connection.end();
        console.log(value); // Success!
    }else{
        console.log("error");
    }
})
需要注意的是使用$(selector).find(selector)查找到的元素需要使用再次使用$()进行包裹才能使用cheerio提供方法,如:text()。
  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一颗小行星!

恰饭ing

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值