更多内容请见: 爬虫和逆向教程-专栏介绍和目录
文章目录
Splash 是一个基于 JavaScript 的渲染服务,主要用于抓取动态网页内容。它能够执行 JavaScript 代码并返回渲染后的 HTML 内容,适用于需要处理动态加载内容的爬虫场景。以下是 Splash 的详细使用指南:
官方文档:https://splash.readthedocs.io/en/stable/
1. 安装与启动 Splash
1.1 使用 Docker 安装
Splash 推荐通过 Docker 安装和运行。
docker pull scrapinghub/splash
docker run -p 8050:8050 scrapinghub/splash
启动后,Splash 服务会运行在