xpath不能正常匹配

最新推荐文章于 2022-07-26 16:18:52 发布

软件测试进阶中

最新推荐文章于 2022-07-26 16:18:52 发布

阅读量1.9k

点赞数 1

分类专栏： python 爬虫文章标签： work

本文链接：https://blog.csdn.net/hard_days/article/details/88396407

版权

python 同时被 2 个专栏收录

43 篇文章 3 订阅

订阅专栏

爬虫

8 篇文章 1 订阅

订阅专栏

记录一下今天掉的坑。。。本来再写爬虫的时候发现xpath能在浏览器里正常使用，但是放到我的项目里就是一个空列表。弄了我将近一个小时。解决方案有两种：

第一种就是携带cookie值。

self.headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36",
            "cookie":"在浏览器中的headers下面复制一个"
        }


然后在访问的时候携带headers就行
response = requests.get(self.start_url, self.headers)

第2种解决方法就是使用selenium

browser = webdriver.Chrome()
browser.get(details_url)
html = browser.page_source
html = etree.HTML(html)
img = html.xpath('//a/@href')  #然后就可以正常的匹配了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

软件测试进阶中

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

正则表达式与 XPath 语法领域细解，初学阶段的你，该怎么学？

梦想橡皮擦，专栏100例写作模式先行者，现象级专栏《Python 爬虫 100 例》作者、《滚雪球学 Python 专栏》原创者

08-21

2万+

周末不休息，更文！

Scrapy中xpath与css的匹配不到内容的问题分析

weixin_73817187的博客

01-14

561

用scrapy爬取某些数据的时候，发现用谷歌或火狐复制的xpath和css返回的数据总是空列表，确实令人费解。

2 条评论您还未登录，请先登录后发表或查看评论

python xpath匹配结果为空

qq_35425070的博客

02-19

1万+

写python爬虫的时候为了省事，通常会在在浏览器中打开F12，右键复制 xpath 。谷歌浏览器这里有一个坑，在这费了半天时间复制的xpath为 python中如下：//*[@id=“mainFrame”]/div/table/tbody/tr/td[1]//text() 使用浏览器插件 xpath helper 测试匹配成功！到了python代码里怎么写都匹配不到，如下 xxx.x...

android元素定位不到,Appium：在Android混合应用程序中无法使用Xpath定位元素？

weixin_39665507的博客

05-26

284

我尝试使用appium.i使用Ionic Framework开发我的应用程序来自动化混合应用程序.我已经完成了整个设置准备就绪.然后我试图在Mozilla.i中找到使用firebug检查的元素,发现特定按钮的xpath是// Button [text()=’BROWSE MENU’].但是当我尝试使用appium进行测试时,它无法找到它,我的测试失败了.我在测试中试过这样的东西driver.fin...

传统推荐算法(一)利用SVD进行推荐（3）6个层面透彻了解奇异值分解

天行健，君子以自强不息

06-14

2403

文章目录写在前面1. 从几何变换到奇异值分解2. 代数角度理解奇异值与奇异向量2.1 从正交基映射推导SVD2.2 特征值分解求解奇异值和奇异向量2.2.1 求解过程2.2.2 推论2.3 SVD的另一种形式3. 几何角度理解奇异值与奇异向量3.1 从坐标变换理解3.1.1 从例子到一般3.1.2 两个问题3.2 形变的角度理解奇异值4. 奇异值的最好解读5. 特征值分解和奇异值分解区别6. 奇异...

python 爬虫实战四：用 selenium 爬取知乎某一问题下所有回答

weixin_43084570的博客

10-31

2378

用 selenium 爬取知乎某一问题下所有回答前言模拟登录动态爬取完整代码效果展示前言最近我又重新拾起了爬虫，想实现一下前几次爬虫所没有涉及到的两个点：模拟登录和动态网页爬取，所采用的方法是利用 selenium 这个库，例子是爬取知乎某一问题下所有回答。模拟登录很多网站，比如知乎、微博、豆瓣，都需要登录之后，才能浏览某些内容。所以想要爬取这类网站，必须先模拟登录。比较简单的方式是利用这个网站的 cookie。cookie 相当于是一个密码箱，里面储存了用户在该网站的基本信息。在一次登录之后，网站

python xpath定位不到_Xpath定位方法深入探讨及元素定位失败常见情况

weixin_39819138的博客

03-01

4552

一、Xpath定位方法深入探讨(1)常用的Xpath定位方法及其特点使用绝对路径定位元素。例如：driver.findElement(By.xpath("/html/body/div/form/input"))。特点：这个路径是从网页起始标签开始一直到要定位的元素的路径，如果要定位的元素在页面最下面，则这个Xpath路径会非常长。如果在要定位的元素与页面开始之间的元素有任何增减，元素定位就会失败。...

XPath Helper版本2.0.2

07-12

描述中提到360极速浏览器8.7在Windows XP系统上能够正常运行XPath Helper 2.0.2，这表明该插件具有较好的向下兼容性，能够满足不同用户的需求。 XPath Helper的核心功能在于实时解析和测试XPath表达式。用户只需在...

xpath_helper_2_0_2.zip

07-12

只需输入XPath表达式，它就能高亮显示匹配的元素，极大地提高了工作效率。 2. **自动完成**：在编写XPath时，工具可能会提供自动补全功能，帮助用户更准确地输入复杂的XPath表达式，减少语法错误。 3. **语法高亮*...

XPath Helper（谷歌浏览器插件）

04-25

2. **XPath查询**：用户可以直接输入XPath表达式，插件将自动在当前页面上高亮显示匹配的元素，帮助验证XPath的正确性。 3. **元素操作**：XPath Helper允许用户对选中的元素进行一些基本操作，如复制XPath、CSS...

爬虫中xpath的返回空列表，xpath的长短和匹配问题

python_neophyte的博客

09-09

5864

在爬某网站的用户地址的过程中发现， /html/body/div[3]/div/div[3]/div[2]/ul/li[4] #这是Chrome上直接对应地址条目，右键复制下来的xpath路径然而以上代码匹配出来是空列表， //div[3]/div[2]/ul/li[4] #这是最后测试能正确匹配到地址的xpath路径，在后面加个/text()就可以返回地址现在还不知道为啥xpa...

xpath meta itemProp标签无法匹配到的问题

小猪佩奇工作室

05-12

2070

部分html代码如下''' <div class="QuestionPage" itemscope="" itemType="http://schema.org/Question"> <meta itemProp="name" content="\u96fe\u973e\u771f\u7684\u89e3\u51b3\u4e0d\u4e86\u4e48\uff1f"/

震惊！xpath定位不到对应元素节点

gofreshman的博客

06-30

2198

震惊！xpath定位不到对应元素节点

xpath定位不到原因浅析

airangrong6572的博客

01-08

5880

在爬虫中，我们经常使用xpath来对元素进行定位，xpath定位分为两种，一种是绝对定位，/html/body/div[2]/div[1]/div/div[3]/a[7]，另外一种是相对定位，比如r'//*[@id ='ul' ]/a[7]' 通常我们可以通过开发者工具，复制元素对应的xpath，这种xpath都是绝对定位，方便获取，但是绝对路径太长，如果里面元素被隐藏了或者元素有变...

Scrapy中诡异xpath的匹配内容失效问题分析

木小鱼的笔记

05-06

4270

引言在爬虫的世界里，xpath是一种非常简单易用的匹配规则，方便我们在web世界里提取需要的各类信息。本文将讲述一个xpath规则无效的问题分析过程。环境介绍 Python 3.6.1 Scrapy 1.5.0 问题在选用xpath之时，都是基于firefox或者chrome中自带的Web开发工具来选取的。这里一般推荐使用chrome的devtool，功能强大，简单易用，童叟...

XPath里面几种定位不到数据的解决办法

qq_36449202的博客

07-28

1万+

1.缩短定位路径，利用属性定位，比序列定位好像好用一些； 2.tbody 标签是个坑，去掉它； 3.查看获取的HTML源码中有没有想要的数据，有的是获取不到的，； 4.学习一下正则表达式，配合使用； ...

xpath 解析后和原网页结构不一致