爬虫之Splash对象方法（二）

最新推荐文章于 2024-05-01 13:23:03 发布

chengqiuming

最新推荐文章于 2024-05-01 13:23:03 发布

阅读量563

点赞数

分类专栏： Splash 文章标签： Splash

本文链接：https://blog.csdn.net/chengqiuming/article/details/86765107

版权

一 autoload()

1 点睛

此方法可以设置每个页面访问时自动加载的对象，使用方法如下：

ok, reason = splash:autoload{source_or_url, source=nil, url=nil}

参数说明如下。

source_or_url：JavaScript代码或者JavaScript库链接。
source：JavaScript代码。
url：JavaScript库链接

但是此方法只负责加载JavaScript代码或库，不执行任何操作。如果要执行操作，可以调用evaljs()或runjs()方法。

2 实例1

2.1 代码

function main(splash, args)
  splash:autoload([[
    function get_document_title(){
      return document.title;
    }
  ]])
  splash:go("https://www.baidu.com")
  return splash:evaljs("get_document_title()")
end

2.2 效果

Splash Response: "百度一下，你就知道"

2.3 说明

这里我们调用autoload()方法声明了一个JavaScript方法，然后通过evaljs()方法来执行此JavaScript方法。

3 实例2

3.1 代码

function main(splash, args)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chengqiuming

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

废文xxx

仲君Johnny的博客

02-17

1653

xxxxxx

爬虫：Splash使用

二十四桥明月夜

01-13

3983

Splash 是一个JavaScript渲染服务，是一个带有HTTP API的轻量浏览器，同时它对接了Python中的Twisted和QT库利用它，可以同样实现动态渲染页面的抓取 1、安装 Scrapy-Splash 是一个Scrapy中支持JavaScript渲染的工具，安装分为两部分，一个是Splash服务的安装，具体是通过docker，安装之后，会启动一个服务，通过它的接口来实现JavaScript 页面的加载，另外一个是Scrapy-Splash的Python库的安装，安装之后可在Scrapy中

1 条评论您还未登录，请先登录后发表或查看评论

Prometheus Operator 配置PrometheusRule告警规则

小楼一夜听春雨，深巷明朝卖杏花

07-19

2637

他们应该用怎样的方式通知我们呢？我们知道之前我们使用自定义的方式可以在Prometheus的配置文件之中指定AlertManager实例和报警的rules文件，现在我们通过Operator部署的呢？对象即可，比如现在我们添加一个etcd是否可用的报警，我们知道etcd整个集群有一半以上的节点可用的话集群就是可用的，所以我们判断如果不可用的etcd数量超过了一半那么就触发报警，创建文件。，用来匹配rule规则的过滤器，我们这里没有过滤，所以可以匹配所有的，假设要求匹配具有。...

Python3爬虫中Splash的知识总结

菜鸟教程

12-10

2894

最新发布

2401_84558983的博客

05-01

692

服务器根据请求客户端的 IP 地址进行哈希计算，确保使用同一个服务器响应请求，这种策略适合有状态的服务，如用户登录后访问某个页面的情形。我们通过 weight 指定了各个服务的权重，权重越高分配到处理的请求越多，假如不同的服务器配置差别比较大的话，就可以使用此种配置。这样默认以轮询策略实现负载均衡，每个服务器的压力相同，此策略适合服务器配置相当，无状态且短平快的服务使用。④　Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）⑤ Python学习路线图（告别不入流的学习）

爬虫之Splash对象方法（三）

实践求真知

02-05

373

一 set_content() 1 点睛用来设置页面内容。 2 代码 function main(splash) assert(splash:set_content("<html><body><h1>hello</h1></body></html>")) return splash:png()

爬虫之Splash对象方法（五）

实践求真知

02-05

1020

一 set_user_agent() 1 点睛设置浏览器的User-Agent 2 代码 function main(splash) splash:set_user_agent('Splash') splash:go("http://httpbin.org/get") return splash:html() end 3 效果二 set_custom_header...

[294]爬虫之scrapy-splash

周小董

07-10

9448

什么是splash Splash是一个Javascript渲染服务。它是一个实现了HTTP API的轻量级浏览器，Splash是用Python实现的，同时使用Twisted和QT。Twisted（QT）用来让服务具有异步处理能力，以发挥webkit的并发能力。目前，为了加速页面的加载速度，页面的很多部分都是用JS生成的，而对于用scrapy爬虫来说就是一个很大的问题，因为scrapy...

Splash的简单使用

李亦华的博客

08-18

4801

Splash Lua脚本http://localhost:8050，端口为8050 入口及返回值 function main(splash, args) splash:go("http://www.baidu.com") splash:wait(0.5) local title = splash:evaljs("document.title") return {title=title} end 通过 evaljs()方法传人 JavaSer刷脚本，而 document.title 的执行

follow-redirects：自动遵循HTTP（S）重定向的Node.js模块

02-03

跟随重定向自动跟随重定向的Node的http和https模块的直接替换。 follow-redirects提供的和方法的行为与在本机和模块上发现的方法相同，不同之处在于它们将无缝地跟随重定向。 const { http , https } = require ( 'follow-redirects' ) ; http . get ( 'http://bit.ly/900913' , response => { response . on ( 'data' , chunk => { console . log ( chunk ) ; } ) ; } ) . on ( 'er

基础篇(6) splash应用

u013089490的博客

07-16

1372

selenium是浏览器测试自动化工具，很容易完成鼠标点击，翻页等动作，确定是一次只能加载一个页面，无法异步渲染页面，也就限制了selenium爬虫的抓取效率。 splash可以实现异步渲染页面，可以同时渲染几个页面。缺点是在页面点击，，模拟登陆方面没有selenium灵活。 1、docker安装splash docker安装splash镜像 [ywadmin@wzy_w...

基于splash的爬虫_01

m0_60255954的博客

12-10

228

Python可以通过HTTP API调用Splash内部的功能,与Lua代码进行交互。是一个JavaScript渲染服务,带有HTTP API的轻量级浏览器。Splash在安装在Docker上,首先要安装docker。安装Splash并启动，如果是linux加sudo。可以使用Lua语言编写代码对页面进行渲染。

[Python3网络爬虫开发实战] --Splash的使用

u012922806的博客

06-10

1689

Splash是一个JavaScript渲染服务，是一个带有HTTP API的轻量级浏览器，同时它对接了Python中的Twisted和QT库。利用它同样可以实现动态渲染页面的抓取。 1. 功能介绍利用Splash可以实现如下功能：异步方式处理多个网页渲染过程；获取渲染后的页面的源代码或截图；通过关闭图片渲染或者使用Adblock规则来加快页面渲染速度；可执行特定的JavaScript脚...

HttpURLConnection

comeontony的博客

02-29

258

setFollowRedirects public static void HttpURLConnection.setFollowRedirects(boolean followRedirects) public void HttpURLConnection.setInstanceFollowRedirects(boolean followRedirects) 前者设置所有的http连...

Python-调用-Splash-API

李亦华的博客

08-18

411

render.html render.html 接口用于获取 JavaScript 渲染的页面的 HTML 代码，接口地址就是 Splash 的运行地址加此接口名称。例如： http://0.0.0.0:8050/render.html?url=https://www.baidu.com&wait=5 http://0.0.0.0:8050 + render.html + https://www.baidu.com + wait=5 import requests url = 'h

【Python】Python3网络爬虫实战-38、动态渲染页面抓取:Splash的使用

Python8年程序员教程分享

07-29

1217

Splash 是一个 JavaScript 渲染服务，是一个带有 HTTP API 的轻量级浏览器，同时它对接了 Python 中的 Twisted和 QT 库，利用它我们同样可以实现动态渲染页面的抓取。 1. 功能介绍利用 Splash 我们可以实现如下功能：异步方式处理多个网页渲染过程获取渲染后的页面的源代码或截图通过关闭图片渲染或者使用 Adblock 规则来加快页面渲染速度可执...

爬虫之Splash基础篇

实践求真知

01-19

7325

一点睛 Splash是一个JavaScript渲染服务，是一个带有HTTP API的轻量级浏览器，同时它对接了Python中的Twisted和QT库。利用它，我们同样可以实现动态渲染页面的抓取。二功能介绍利用Splash，我们可以实现如下功能：异步方式处理多个网页渲染过程；获取渲染后的页面的源代码或截图；通过关闭图片渲染或者使用Adblock规则来加快...

【翻译】如何使用Blackbox Exporter监控Kubernetes中的端点

超级码力

08-14

430

作者：苏拉米亚-沙阿 1月20日，2022年原文为Suramya Shah在InfraCloud的博客上发表的客座文章监控端点是系统可观察性的一个重要方面，用于诊断性能和可用性问题。在这篇文章中，我们将详细介绍如何使用Blackbox Exporter和Prometheus在Kubernetes中实现端点监控。什么是Prometheus导出器？ Prometheus Exporte...

python爬虫 Splash动态数据

03-19

# 创建Splash对象 splash = Splash() # 设置请求参数 url = 'http://example.com' # 目标网页的URL script = """ function main(splash) splash:go(splash.args.url) splash:wait(5) # 等待页面加载完成 ...