node爬取app数据_nodeJs爬虫获取数据简单实现代码

本文实例为大家分享了nodeJs爬虫获取数据代码,供大家参考,具体内容如下

var http=require('http');

var cheerio=require('cheerio');//页面获取到的数据模块

var url='http://www.jcpeixun.com/lesson/1512/';

function filterData(html){

/*所要获取到的目标数组

var courseData=[{

chapterTitle:"",

videosData:{

videoTitle:title,

videoId:id,

videoPrice:price

}

}] */

var $=cheerio.load(html);

var courseData=[];

var chapters=$(".list-collapse");

chapters.each(function(item){

var chapterTitle=$(this).find(".collapse-head").find("label").text();

var videos=$(this).find(".listview5").children("li");

var chaptersData={

chaptersTitle:chapterTitle,

videosData:[]

}

videos.each(function(item){

var videoTitle=$(this).find(".ml10").attr('data-lesson-name');

var videoId=$(this).find(".ml10").attr('data-lesson-id');

var vadeoPrice=$(this).find(".colblue").text();

chaptersData.videosData.push({

title:videoTitle,

id:videoId,

price:vadeoPrice

})

})

courseData.push(chaptersData)

})

return courseData

}

function printCourseInfo(courseData){

courseData.forEach(function(item){

console.log(item.chaptersTitle+'\n');

item.videosData.forEach(function(item){

console.log(item.title+'【'+item.id+'】'+item.price+'\n')

})

})

}

http.get(url,function(res){

html="";

res.on("data",function(data){

html+=data

})

res.on('end',function(){

var courseData=filterData(html);

printCourseInfo(courseData)

})

})

效果图:

以上就是nodeJs爬虫获取数据的相关代码,希望对大家的学习有所帮助。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值