一、介绍
1.提供JavaScript渲染服务
2.带有HTTP API的轻量级浏览器
3.对接了Python中的Twisted和QT库
Splash文档:传送门
二、知识点
1. Lua脚本
1.1 介绍
Lua 是一种轻量小巧的脚本语言,用标准C语言编写并以源代码形式开放, 其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能。
1.2 使用
Splash Lua脚本的入口函数和返回值:
function main(splash, args)
assert(splash:go(args.url))
assert(splash:wait(0.5))
return {
html = splash:html(),
png = splash:png(),
har = splash:har(),
}
end
2. Splash API
2.1 介绍
Python等编程语言可以通过API调用Splash渲染页面,抓取JavaScript渲染的页面。
2.2 使用
1.render.html
此接口用于获取JavaScript渲染的页面的HTML代码,接口地址就是Splash的运行地址加此接口名称。
示例:
import requests
SPLASH_ADDRESS='http://localhost:8050/'
render_url='www.baidu.com'
url=SPLASH_ADDRESS+'render.html?url='+render_url
response=requests.get(url)
html=response.text()
2.render.png
3.execute
使用此接口可实现Python与Splash Lua脚本的对接。