元素 2.选择需要的元素
3.右键打开上下文菜单
4.复制→复制 选择XPATH
5.粘贴到编辑器
比较容易复制 这个方法也方便因为它可以完成并且节点路径或属性没有拼写错误。
XPath的其他方法请参考本站(创建爬虫需要!XPATH符号汇总)。
我们来看看实际的处理过程。
显示网页
准确的说是获取浏览器驱动请求的网页响应的过程。为了表达方便,将其描述为显示。
摘抄
from selenium import webdriver options = webdriver.ChromeOptions() driver = webdriver.Remote(command_executor='172.21.0.3:4444/wd/hub', options=options) # ブラウザでWebページを開く driver.get('https://xxxxxxxx.herokuapp.com/')
从库中导入 selenium webdriver。
(可选)指定要启动的浏览器。这次我设置了Chrome驱动程序。
您可以通过创建在另一个容器中创建的远程服务器对象并将 URL 作为参数传递给 get() 方法来显示网页。
单击按钮元素
就是点击红框中的按钮的过程。
摘抄
bicycle_button = driver.find_element(By.XPATH, '//input[@id="button_bicycle"]') bicycle_button.click()
要单击按钮元素,请使用 find_element() 方法为目标元素创建一个对象并调用 click() 方法。
从元素中获取文本
从红框的p元素中获取蓝色字符的文本是一个过程。
摘抄
bicycle_page_message_2 = driver.find_element(By.XPATH, '//p[@id="sum_milage"]').get_attribute('textContent')
要获取元素的文本,请使用 find_element() 方法创建目标元素的对象并调用 get_attribute() 方法。
<