python爬虫：定位目标数据位置（一）

最新推荐文章于 2024-04-16 11:11:04 发布

万物皆乱

最新推荐文章于 2024-04-16 11:11:04 发布

阅读量3.3k

点赞数 1

分类专栏：爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48697341/article/details/107576541

版权

爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

python爬虫中，定位目标数据位置是很关键的一步，今天就来讲其中的一种方法，也是最基础的一种方法。
首先怎么看一个网页的源代码，例如打开知乎首页（网址：https://www.zhihu.com/explore），在网页任意空白处单击右键，然后点击【查看网页源代码】选项，就可以查看源代码了：
在这里插入图片描述源代码如下：

如果你是用Chrome浏览器，也可以直接在网页前面加前缀view-source:如，view-source:https://www.zhihu.com/explore，也是可以找到网页源代码。

网页源代码是包含了网页的所有内容，但我们一般只需要部分的内容，如我只需要爬取知乎首页的某个标题信息，如下，鼠标停留在目标位置，单击右键，然后点击【检查】选项，就可以定位到该数据的代码位置了：
在这里插入图片描述目标数据位置如下：

最后再通过python代码将数据爬取出来，爬取代码请参考我的上一篇文章《python爬虫实例：爬取知乎首页专题信息》。

感悟：一步一个脚印，加油！

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python爬虫：定位目标数据位置（一）

python爬虫中，定位目标数据位置是很关键的一步，今天就来讲其中的一种方法，也是最基础的一种方法。首先怎么看一个网页的源代码，例如打开知乎首页（网址：https://www.zhihu.com/explore），在网页任意空白处单击右键，然后点击【查看网页源代码】选项，就可以查看源代码了：源代码如下：如果你是用Chrome浏览器，也可以直接在网页前面加前缀view-source:如，view-source:https://www.zhihu.com/explore，也是可以找到网页源代码。网页源
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。