nodejs 写爬虫爬取最近上映电影数据

最新推荐文章于 2021-11-06 16:14:04 发布

波比小金刚

最新推荐文章于 2021-11-06 16:14:04 发布

阅读量1.3k

点赞数 1

分类专栏： javascript 文章标签： node 爬虫

本文链接：https://blog.csdn.net/javaexploreroooo/article/details/54633257

版权

javascript 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

直接上代码：这是http模块

'use strict'
//引入内建和第三方模块
const https = require("https")
const url = require("url")
const Promise = require("bluebird")

//创建启动服务模块
function start(url){
	return new Promise((resolve,reject)=>{
			https.get(url,(res)=>{
			const statusCode = res.statusCode
			const contentType = res.headers['content-type']

			let error

			if(statusCode != 200){
				error = new Error(`请求失败.\n`+`code:${statusCode}`)
			}

			if(error){
				console.log(error)
				res.resume()
				return
			}

			res.setEncoding("utf-8")
			let getData = ""

			res.on("data",(datachunk)=>{
				getData += datachunk
			})

			res.on("end",()=>{
				resolve(getData)
			})
		}).on("error",(e)=>{
			reject(e)
			console.log("获取数据出错")
		})
	})
}


exports.start = start

主程序入口:

const crawler = require("./crawler")
const querystring = require("querystring")
const cheerio = require("cheerio")
const fs = require("fs")
//url
const douban_url = "https://movie.douban.com/nowplaying/chengdu/"

crawler.start(douban_url).then(res=>{
	var $ = cheerio.load(res)
	var data = []
	$('#nowplaying .list-item').each(function(i,e){
		var obj = "obj" + i
		obj = {}
		obj.title = $(e).attr("data-title")+"\n"
		obj.score = $(e).attr("data-score")+"\n"
		obj.src = $('#nowplaying .list-item img').attr("src")+"\n"
		data.push(obj)
	})
	fs.writeFileSync("./get_data/data.txt",JSON.stringify(data));
})

效果展示:

波比小金刚

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
nodejs 写爬虫爬取最近上映电影数据

直接上代码：这是http模块'use strict'//引入内建和第三方模块const https = require("https")const url = require("url")const Promise = require("bluebird")//创建启动服务模块function start(url){ return new Promise((resolve,re
复制链接

扫一扫