如何用python爬虫中的xpath抓取信息？

最新推荐文章于 2023-05-06 23:21:52 发布

python学习网py.cn

最新推荐文章于 2023-05-06 23:21:52 发布

阅读量461

点赞数

分类专栏： python 爬虫文章标签： python

原文链接：https://www.py.cn/jishu/jichu/21113.html

版权

python 同时被 2 个专栏收录

54 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

在学习了python爬虫模块后，小编对于获取数据的方法仿佛打开了新的思路。方法之间没有哪种可以不局限于所有的使用环境，小编在每次写的时候都会注明使用，小伙伴们看的时候需要留意，不然运行后弄出乌龙就尴尬了。下面我们一起来看看xpath是如何在python爬虫中抓取信息的吧。
我们使用xpath语法来提取我们所需的信息。不熟悉xpath语法的自行学习一下，很快就能上手，难度不高。首先我们在chrome浏览器里进入豆瓣电影TOP250页面并按F12打开开发者工具。
在这里插入图片描述

我们可以看到每一部电影的信息都在一个

…
里，打开后可以找到我们想要的全部信息，其中spider中初始的request是通过调用 start_requests() 来获取的。 start_requests() 读取 start_urls 中的URL，并以 parse 为回调函数生成 Request。看一下代码：

以上就是xpath语言在python爬虫中抓取信息的方法了，没想到小小的语法还有这么多的作用吧。

python学习网py.cn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何用python爬虫中的xpath抓取信息？

在学习了python爬虫模块后，小编对于获取数据的方法仿佛打开了新的思路。方法之间没有哪种可以不局限于所有的使用环境，小编在每次写的时候都会注明使用，小伙伴们看的时候需要留意，不然运行后弄出乌龙就尴尬了。下面我们一起来看看xpath是如何在python爬虫中抓取信息的吧。我们使用xpath语法来提取我们所需的信息。不熟悉xpath语法的自行学习一下，很快就能上手，难度不高。首先我们在chrome浏览器里进入豆瓣电影TOP250页面并按F12打开开发者工具。我们可以看到每一部电影的信息都在一个…里
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。