CSDN模拟用户访问

本教程仅供学习,禁止用于其他用途

使用 superagent 与 cheerio两个库 模拟用户访问

  • 在config.json 中添加自己的博客地址(我的博客页的网址)
    在这里插入图片描述

  • 安装依赖,开始跑即可

此次demo所有代码都上传到GitHub中,有需要的同学自取,记得给个star噢,传送门

分析代码组成

1.初始化

	init() {
		return new Promise((resolve, reject) => {
			var _this = this
			//读取文件博客地址
			var data = fs.readFileSync('config.json', 'utf-8')
			this.baseURL = JSON.parse(JSON.parse(JSON.stringify(data))).blogURL
			//获取博客列表的URL地址
			superagent
				.get(this.baseURL)
				.then((res) => {
					const $ = cheerio.load(res.text)
					var list = $('.article-list').find('.article-item-box')
					list.each(function () {
						var href = $(this).find('a').attr('href')
						_this.blogs.push(href)
					})
					resolve(_this.baseURL)
				})
				.catch((e) => {
					console.log(e)
				})
		})
	}
  • 引入 fs 模块 读取config配置
  • 使用superagent 访问获取博客页的html
  • 使用cheerio 将html 解析
  • 操作DOM 获取博客列表的URL,将其保存

2.访问

    // 访问
	visit() {
		this.blogs.map((item, index) => {
			superagent
				.get(item)
				.then((res) => {
					console.log('success')
				})
				.catch((e) => {
					console.log(e)
				})
		})
	}
  • 没有啥好说的了,就是对URL列表循环然后依次访问

3.全代码

var superagent = require('superagent')
const cheerio = require('cheerio')
const fs = require('fs')

class Spider {
	constructor() {
		this.baseURL = ''
		this.blogs = []
	}

	init() {
		return new Promise((resolve, reject) => {
			var _this = this
			//读取文件博客地址
			var data = fs.readFileSync('config.json', 'utf-8')
			this.baseURL = JSON.parse(JSON.parse(JSON.stringify(data))).blogURL
			//获取博客列表的URL地址
			superagent
				.get(this.baseURL)
				.then((res) => {
					// console.log(res.text)
					const $ = cheerio.load(res.text)
					var list = $('.article-list').find('.article-item-box')
					list.each(function () {
						// console.log(this)
						var href = $(this).find('a').attr('href')
						_this.blogs.push(href)
					})
					resolve(_this.baseURL)
				})
				.catch((e) => {
					console.log(e)
				})
		})
	}
    // 访问
	visit() {
		this.blogs.map((item, index) => {
			superagent
				.get(item)
				.then((res) => {
					console.log('success')
				})
				.catch((e) => {
					console.log(e)
				})
		})
	}
}

var spider = new Spider()
spider.init().then(() => {
	setInterval(() => {
		spider.visit()
	}, 10000)
})

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值