动态渲染爬虫超简单方法分享--豆瓣

动态渲染爬虫超简单方法分享–豆瓣

最近需要一些电视剧数据,找来找去发现还是豆瓣的数据比较全,于是就想这怎么写个脚本获取一下,打开豆瓣的pc官网电视剧板块捣鼓的半天,发现它没有用分页的方式展示数据,而是用的动态加载,需要滑动到底部,点击按钮才能继续获取。
在这里插入图片描述
然后想着肯定是调用接口实现的,直接爬接口不就行了,打开调试台后,发现接口用的都不是明文,还要解密太麻烦了,只能继续研究,没想到这个时候意外按到了chromectrl+s,将保存网页到本地功能,保存之后,在本地打开发现,保存下来的html文件里面有着 所有动态加载完的数据,那我岂不是只要先在chrome 里面让网页全部动态加载完,然后再一保存到本地,数据不就获取到了,

完美~

下面介绍方法以豆瓣为例,其他动态加载的网页没试过,估计也能用:
先打开豆瓣电视分区

https://movie.douban.com/tv/

然后选择到分类
在这里插入图片描述

接着按下f12,打开调试控制台输入以下代码,回车后等待大概四五十秒

setInterval(()=>{
	document.querySelector(".explore-more button").click()
}, 1500);

等待全部数据动态记载完后,滑动滚动条到底部,检查是否加载完毕,加载完了就可以ctrl+s保存数据了,保存后你会发现,不仅网页数据被保存了,相关的静态资源图片、css也都给保存,这样电视局的基础数据就都获取到了,如果还需要详情信息那还是需要进一步写爬虫的。
保存下来的html文件可以直接用cherrio读取然后就可以获取数据。

  • 注意一定要等浏览器保存完毕,否则可能会出现html没用保存成功的情况
    在这里插入图片描述

随便分享一下,文笔不好的地方请见谅~

cherrio是nodejs npm的库,非常好用;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

三秦读书人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值