叮铃铃!叮铃铃!老师:“小明 你的梦想是什么?”, 沉思了一下 小明:“额额 我想有车有房,自己当老板,媳妇貌美如花,还有一个当官的兄弟” 老师:“北宋有一个人和你一样···”;
哈喽!大家好! 请叫我布莱恩·奥复托·杰森张;
爬虫部分!
一提到爬虫,好多人先想到python 没错就是那个py交易的那个,这货所为是什么都能干 上九天揽月下五洋捉鳖无处不出现它的身影 鄙人对它也是不得不折服,在爬虫这货缺点在于编码格式上还有那些DOM操作他就不是那么得心应手,so 这家伙 就是nodejs依赖着对于前端的粘合性,这货做扒手也是一绝啊!咱们先三八一下它 虽然本人学的也是懵懵懂懂,但是咱毕竟靠吹牛逼起家,就告诉你们我就是吹牛逼,你们看看它爆不爆! 嘿嘿嘿
爬虫大本分是为了获取网络数据,哎 又爱说废话 直接上代码了
var cheerio = require('cheerio'); 这个东西呢 可以简单理解为Nodejs里面的JQuery。它包括了 jQuery 核心的子集,Cheerio 从jQuery库中去除了所有 DOM不一致性和浏览器尴尬的部分,揭示了它真正优雅的API。
var superagent = require('superagent'); 这东西简单理解为Node里面的Ajax。superagent 是一个轻量的,渐进式的ajax api,可读性好,学习曲线低,内部依赖nodejs原生的请求api,适用于nodejs环境下。
var http = require('http'); Node自带http服务框架;
东西备的差不多了,这个意思大家应该清楚,就是node模拟浏览器发送 ajax在信息中心提取自己想要的东西;介于一般成熟性网站都会做的很是讲究,所以你查找元素也是很简便嘛,一下为部分代码,希望大家理解意思就好,毕竟代码还要自己写,复制黏贴错都找不到!
superagent.get(links).end(function (err, sres) {
// 常规的错误处理
if (err) {
return next(err);
}
// sres.text 里面存储着网页的 html 内容,将它传给 cheerio.load 之后
// 就可以得到一个实现了 jquery 接口的变量,我们习惯性地将它命名为 `$`
// 剩下就都是 jquery 的内容了
var $ = cheerio.load(sres.text);
ans += $(".channel").text() +' 宝贝名称:<br/><br/>';
$('#J_Title').each(function (index, item) {
var $item = $(item);
ans += $item.find("