NodeJS 爬取lol英雄数据信息

1、安装node.js  Node.js官网 

 2、直接上代码

 

var http = require('http');
var fs = require('fs');		// 文件系统模块

var cheerio  = require('cheerio'); // 抓取网页数据模块,需要安装,npm install cheerio
var url = 'http://lol.duowan.com/hero/'; // 我要爬取的网站

http.get(url, function(res) {
	var html = '';
	res.on('data', function(data) {
		html += data;
	});

	res.on('end', function(){
		// console.log(html);  // 获取到的网页源码
		filterChapters(html);
	})
}).on('error', function() {
	console.log('获取网页源码失败....');
})

function filterChapters(html) {
	var $ = cheerio.load(html);	
	var element = $('.champion_tooltip');
	var heroNames = element.children('h2');  // 通过选择器查找元素
	var heroAliass = element.find('h3');
	var heroIntroduces = element.find('p');
	var heroTypes = element.find('span');

	// 英雄对象     // 对象数组
	var hero = {}, heros = []; 
	var sql;
	var str;
	for (var i = 0; i < heroNames.length; i++) {
		sql = 'insert into lolhero(heroName, heroAlias, heroIntroduce, heroType) ' + 
		' values (\''+$(heroNames[i]).text()+'\',\''+$(heroAliass[i]).text()+'\',\''+$(heroIntroduces[i]).text()+'\',\''+$(heroTypes[i]).text()+'\');';
		hero = {
			heroName : $(heroNames[i]).text(),
			heroAlias : $(heroAliass[i]).text(),
			heroIntroduce : $(heroIntroduces[i]).text(),
			heroType : $(heroTypes[i]).text()
		}
		// 返回json数组
		heros.push(hero);
		// 返回sql语句
		str += sql;
	}
	// 将所有的英雄信息生成sql语句
	var out = fs.createWriteStream('./sql.txt')
	out.write(str);
	console.log(heros.length);
	console.log(str);
}

3、创建数据库 Mysql

DROP TABLE IF EXISTS `lolhero`;
CREATE TABLE `lolhero`  (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `heroName` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `heroAlias` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `heroIntroduce` varchar(500) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `heroType` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
)

 4、有一点要注意的:爬取出来的数据,有的会多一个  '  号导致数据错误,如下图:

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwMDU4MzIx,size_16,color_FFFFFF,t_70

5、大功告成,初学所写,勿见怪 ....

 watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwMDU4MzIx,size_16,color_FFFFFF,t_70

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

cocosum

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值