ruby selenium-webdriver 使用记录

最新推荐文章于 2024-05-30 09:39:55 发布

0_0__

最新推荐文章于 2024-05-30 09:39:55 发布

阅读量910

点赞数 1

分类专栏： crawler ruby selenium-webdriver

crawler 同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

ruby

1 篇文章 0 订阅

订阅专栏

selenium-webdriver

1 篇文章 0 订阅

订阅专栏

原文地址

WHAT

记录一下ruby下，selenium-webdriver的使用方法；

WHY

最近在用selenium-webdriver抓取数据，但是好像没有找到什么相关的文档，许多东西只能一点点的找，用过后又总是忘记，就写下来，以备查阅；

HOW

安装gem包

	gem install selenium-webdriver

引入gem包

require 'selenium-webdriver'

正常使用（chrome）

# 会打开一个谷歌浏览器
dr = Selenium::WebDriver.for :chrome

无头浏览器（chrome）

# 会在后台打开一个浏览器（headless）
options = Selenium::WebDriver::Chrome::Options.new
options.add_argument('--headless')
options.add_argument('--disable-gpu')
dr = Selenium::WebDriver.for :chrome, options: options

切换标签页

dr.window_handles #返回已有的标签页id
dr.window_handle  #返回当前标签页id
dr.switch_to.window dr.window_handles[1] #切换到第一个标签页

设置超时时间

dr.manage.timeouts.page_load = 30
begin
  dr.get 'https://www.example.com'
rescue
  retry if dr.find_elements(:css, 'div.content[id="1"]').length < 1
end

获取网页源码

page = dr.page_source

获取属性

class = dr.find_elements(:css, 'div#div-id').attribute('class')

点击事件

dr.find_elements(:css, 'div#content[id="1"]').click

END

未完待续……

0_0__

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
ruby selenium-webdriver 使用记录

原文地址WHAT记录一下ruby下，selenium-webdriver的使用方法；WHY最近在用selenium-webdriver抓取数据，但是好像没有找到什么相关的文档，许多东西只能一点点的找，用过后又总是忘记，就写下来，以备查阅；HOW安装gem包 gem install selenium-webdriver引入gem包require 'selenium-webdri...
复制链接

扫一扫