Python爬虫编程思想(45):在Chrome中自动获得XPath代码

本文介绍了如何在Chrome浏览器中利用开发者工具自动获取XPath代码,以抓取京东商城首页导航条文本为例,详细阐述了从获取XPath到修改并应用于Python爬虫的过程。
摘要由CSDN通过智能技术生成

        尽管XPath代码写起来要比正则表达式简单得多,但如果遇到复杂的节点,仍然写起来比较费劲,幸好很多浏览器提供了自动获取XPath代码的能力。我们可以在自动获取的XPath代码的基础上修改,甚至很多时候不需要修改就可以直接使用。本节用Chrome浏览器来演示如何获取特定节点的XPath代码。

        下面的例子在Chrome浏览器中通过开发者工具获取京东商城首页与导航条对应的XPath代码,并稍加修改,然后利用requests库抓取导航条文本。

现在进入京东商城首页(https://www.jd.com),导航条如图1所示黑框中的内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值