[Python] 用 Docker + Python + Selenium 抓取,最新大厂Python校招面试经验汇总

元素 2.选择需要的元素

3.右键打开上下文菜单

4.复制→复制 选择XPATH

5.粘贴到编辑器

比较容易复制 这个方法也方便因为它可以完成并且节点路径或属性没有拼写错误。

XPath的其他方法请参考本站(创建爬虫需要!XPATH符号汇总)。

我们来看看实际的处理过程。

显示网页

准确的说是获取浏览器驱动请求的网页响应的过程。为了表达方便,将其描述为显示。

摘抄

from selenium import webdriver options = webdriver.ChromeOptions() driver = webdriver.Remote(command_executor='172.21.0.3:4444/wd/hub', options=options) # ブラウザでWebページを開く driver.get('https://xxxxxxxx.herokuapp.com/')

从库中导入 selenium webdriver。

(可选)指定要启动的浏览器。这次我设置了Chrome驱动程序。

您可以通过创建在另一个容器中创建的远程服务器对象并将 URL 作为参数传递给 get() 方法来显示网页。

单击按钮元素

就是点击红框中的按钮的过程。

摘抄

bicycle_button = driver.find_element(By.XPATH, '//input[@id="button_bicycle"]') bicycle_button.click()

要单击按钮元素,请使用 find_element() 方法为目标元素创建一个对象并调用 click() 方法。

从元素中获取文本

从红框的p元素中获取蓝色字符的文本是一个过程。

摘抄

bicycle_page_message_2 = driver.find_element(By.XPATH, '//p[@id="sum_milage"]').get_attribute('textContent')

要获取元素的文本,请使用 find_element() 方法创建目标元素的对象并调用 get_attribute() 方法。

<
  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值