自动爬取SF文章并推荐到掘金--Puppeteer再探

本文介绍了如何利用Puppeteer爬取SegmentFault的前30篇热门文章,并自动推荐到掘金平台。通过Puppeteer进行屏幕快照、高级爬虫、UI自动化测试和页面性能分析等操作,详细阐述了爬取和推荐的具体流程,包括登录、模拟用户操作等步骤。项目源代码已开源,可供进一步研究。
摘要由CSDN通过智能技术生成

原文链接:http://zhentaoo.com/2017/10/22/Pupputeer2
看过上篇的同学,应该都会使用Puppeteer的高级爬虫功能了,附上姐妹篇链接:
爬取并生成《ES6标准入门》PDF–Puppeteer初探
除了爬虫之外,也可以使用Puppeteer完成页面上任意操作,即: 可以用来做UI自动化测试
开门见山,今天的目标是,爬取SF的热门文章,自动推荐到掘金!!!

简要提下Puppeteer的应用场景

  1. 屏幕快照,打印PDF
  2. 高级爬虫(有别于传统爬虫.使用Puppeteer可以拿到渲染后的效果,传统爬虫相当于只能拿到http response)
  3. UI自动化测试(使用Puppeteer可以模拟用户操作)
  4. 页面性能分析

废话不多说,直接上动图/视频看效果

GIF图片比较大,如果不能加载成功,也可以到微博看下录制的视频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值