一、抓包入库
-
抓包
1.1. 导包
1.2. 创建一个请求英雄信息的实例
1.3 发请求
1.4 声明一个全局变量heros数组,用来存放所有的英雄的
1.5 创建一个请求详情的爬虫实例
1.6 要等待所有的请求全部做完之后,才能入库
-
入库
2.1 导包
2.2 连接数据库
2.3 3.创建Model(表格模型:负责增删改查)
-
代码
// 1.抓包:用爬虫crawler插件来爬网页上的数据 // 2.入库:用mysql-ithm插件吧爬到的数据装进数据库中 // 1.抓包 // 导包 var Crawler = require("crawler"); // 创建一个请求英雄信息的实例 var c = new Crawler({ maxConnections : 10, // This will be called for each crawled page callback : function (error, res, done) { if(error){ console.log(error); }else{ var $ = res.$; // $ is Cheerio by default //a lean implementation of core jQuery designed specifically for the server // console.log(JSON.parse(res.body));// 所有英雄,包含了所有对象的数组 // 所有的英雄,都要去获取他的头像和技能. // 所以要遍历出每一个英雄的ename,拼接一个详情页路径重新发送请求. JSON