layui获取input信息_通过xpath快速获取页面元素的方法

背景

在爬虫的过程中,我们需要很准确的定位到页面元素的位置。

定位元素最简单的方法就是通过xpath和css。本文主要介绍xpath相关的笔记。

比如用selnium的时候,可以这样

7b9ab146cc8b1d28c3e2ad7f0d225464.gif

xpath 简介

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。

路径表达式结果
bookstore选取 bookstore 元素的所有子节点。
/bookstore选取根元素 bookstore。
注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!
bookstore/book选取属于 bookstore 的子元素的所有 book 元素。
//book选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book选择属于 bookstore 元素的后代的所有   book元素,而不管它们位于 bookstore 之下的什么位置。
//@lang选取名为 lang 的所有属性。

以上的信息如何决定晦涩难懂,那本文推荐一个xpath的利器xpath helper

xpath helper介绍

这里摘取一下,官方介绍

XPath Helper makes it easy to extract, edit, and evaluate XPath queries on any webpage.

xpath helper使从页面获取信息更简单了

xpath helper是chrome的一个插件,如果要使用这个工具,必须使用chrome浏览器。

安装

如果能够访问google应用商店,直接在chrome地址栏输入https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl?hl=zh_CN

a5f540c9554c01c4224081044941d7cc.png

点击添加到chrome就可以了。

  • 离线安装
  1. 如果不能访问google,就需要将这个插件下载下来,下载之后试一下ctx格式的文件,直接用rar工具将其解压到一个文件夹。
  2. 在浏览器输入chrome://extensions/ ,右上角切换打开开发者模式。选择“加载已解压的的扩展程序”,选择刚刚解压的文件夹即可

9761d6595713237456cc6161315f986c.png

使用

安装完成之后,就可以使用了。

  • 打开/关闭 在windows下使用快捷键:Ctrl+Shift+X ,打开xpath窗口

  • 18aa2098414cc22a417f93a4789a0c19.gif

  • 获取页面元素 打开窗口之后,鼠标移动到具体的位置,按住shit键即可

  • 如何使用xpath 这里以selenium + chrome为例

比如拿到百度搜索页面,搜索案例的xpath是

'wrapper']/div[@id=

那么我们在selenium下可以这样定位到这个元素,并调用比如click方法,模拟点击。

"/html/body/div[@id='wrapper']/div[@id='head']/div[@id='head_wrapper']/div[@class='s_form s_form_nologin']/div[@class='s_form_wrapper soutu-env-nomac soutu-env-index']/form[@id='form']/span[@class='bg s_btn_wr']/input[@id='su']").click()

通过浏览器获取xpath

现在的浏览器大部分都是chrome内核,都提供了开发者工具(浏览器页面打开F12),里面可以看到页面元素以及请求的地址。同时也提供如xpath的定位方法。同样以chrome浏览器为例

首先F12开发者工具,然后选到element,在根据层级,找到需要元素的位置,比如这里找“百度一下”,鼠标选中之后,页面上会跟着变化选择的区域。找到之后,直接右键copy,选择xpath也可以。

fc461e65f0daaa5723945f21dc22f16a.gif

最后总结一下

通过xpath helper和浏览器获取到xpath的区别:xpath是从第一个

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值