首先,这章是为数据爬取做铺垫的。在爬取过程中,我们总是会遇到排版工整的结构,面对这种情况,总不可能一一获取它们的定位吧。这时,我们就可以批量选择这些元素,以获得它们的定位。
list元素选择设置
如图1、2、3所示。
选择最外层
首先点击右上角的“眼睛”按钮,确保进入选择模式。
以我的文章为例
先找到最大的框框,选中它,并确保每一篇文章都被一个框框选中
选择次一级的框框
在上一步的基础上,再去点击红色选中框框内的元素,这里选择了文章标题。
这时可以看到每个标题都被红色框框选中,这时我们就拥有了标题的定位了。
同理,我们还可以获取文章的简介、时间等等。
接下来一章会去介绍爬取数据中数据的保存问题。
再接下来一章就是数据爬取的小练习了。