记第一次尝试使用node进行爬虫的经历（使用cheerio模块）

最新推荐文章于 2023-10-02 19:59:33 发布

天际线上的猪

最新推荐文章于 2023-10-02 19:59:33 发布

阅读量419

点赞数 1

分类专栏： nodejs 文章标签： nodejs js

本文链接：https://blog.csdn.net/qq_44573890/article/details/107874035

版权

本文记录了作者初次尝试使用Node.js进行爬虫的体验，主要利用cheerio模块抓取网页信息。在过程中，还涉及到了axios、fs和express模块的使用。文章详细介绍了axios的基本概念，cheerio作为服务器端jQuery实现的功能，以及如何通过它们配合完成爬取、解析和保存数据的操作。尽管在请求模块选择上遇到了问题，但最终成功完成了爬虫的编写，作者认为这是一次有价值的实践和学习经历。

摘要由CSDN通过智能技术生成

简介

这是我第一次尝试爬虫，也是第一次使用node爬虫，有啥写的不好的望各位大佬多多指教。

本实验是基于nodejs中，使用cheerio模块实现简单爬取网站所需信息，因为在次实例中（本次实例的网址）需要做到写入文件以及启动我们自己的服务（可能不用）和创建http请求，所以还需要用到另外三个模块，fs、express以及axios

模块安装

npm init -y #跳过向导，快速生成package.json说明书文件
npm i --save axios
npm i --save express
npm i --save cheerio

axios简介

Axios 是一个基于 promise 的 HTTP 库，可以用在浏览器和 node.js 中

axios文档

cheerio简介

Fast, flexible & lean implementation of core jQuery designed specifically for the server.

官网文档

express简介

基于 Node.js 平台，快速、开放、极简的 Web 开发框架

express中文网

模块引入

在这里其实有个小插曲，一开始是想用request模块去请求目标网址，可是不知道出现何种原因，请求不了（用这个模块尝试其它网址是可以的），所以更换成了axios模块

const express = require('express')
const cheerio = require(

最低0.47元/天解锁文章

天际线上的猪

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录