尝试使用Node爬取页面内容

博主分享了如何使用Node.js和Cheerio库重构之前基于SpringBoot+Jsoup的菜谱数据爬虫,将小程序与个人服务器解耦,转向微信小程序的云开发。通过提供多个测试接口,演示了如何实现数据抓取和解析,代码已开源,适合对微信小程序云开发和Node爬虫感兴趣的开发者参考。
摘要由CSDN通过智能技术生成

前情概要

由于我主职是Java开发,所以在之前开发的菜谱小程序中使用springboot+jsoup实现了菜谱数据的爬取,但是这样上线的小程序就必须依赖于我自己的服务器,万一哪天我囊中羞涩不续费我的小服务器了那不是小程序也终结了?所以我选择使用微信小程序的云开发重构它,这样可以让它一直运行着,毕竟免费的限额以我这个小程序还不至于超出去的,但是云开发使用的是node,所以经过查资料和写demo做了一个简单的测试分享出来。希望对大家有帮助。

正式介绍

我采用的是node+cheerio,cheerio主要就是用来进行解析html,起始它和jsoup的使用方法类似,都是类似jQuery的样式选择器语法,所以使用起来很方便。
代码地址:https://gitee.com/hlovez/node-reptile.git

拉取代码后启动程序

git clone https://gitee.com/hlovez/node-reptile.git
cd node-reptile
npm start

运行demo后访问http://localhost:3000后会出现一个简单的页面共大家测试效果,如下图:
在这里插入图片描述
我这里提供了5个测试接口:

  • 测试接口
  • 获取每日三餐接口
  • 获取首页不同类型推荐列表
  • 查询菜谱接口
  • 查询指定菜谱详情接口

具体每个接口可点击超链接查看内容,效果如下:
在这里插入图片描述
具体使用方法可以查看index.js这个文件里的内容。爬取其他数据也是类似这样的逻辑。

https://gitee.com/hlovez/node-reptile.git

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@胡海龙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值