02_爬虫入门级教程_如何解析数据?

一.概述

爬虫分两步走,首先要对你想要获取数据的目标网址进行解析,明确所要获取的数据,以及目标网页的结构,其次,在进行数据的爬取。
上一节,大家了解到了什么是网络爬虫和爬虫的一些基本知识。那么这一章就以爬取猫眼电影 Top 100 为实例,先教大家如何解析网页。

二.解析网页

1.打开网页

猫眼电源top10网页
页面如下:
在这里插入图片描述

2.审查元素

右键检查元素,我这里以火狐浏览器为例

在这里插入图片描述
就会出现下列源代码
在这里插入图片描述

那这有什么作用呢??
我们爬取数据,首先得分析网页的结构,这就要根据源代码来。图中箭头指向的是一个选择器,点击他然后在网页中查看你想要的地方就回跳出响应的源代码。

3.明确元素

在此次网页中我们要明确趴取得元素:排名、封面图片、影片名、主演、上映时间、评分
每一部电影信息都在

当中
在这里插入图片描述

4.查看所需爬取元素所在位置

在这里插入图片描述
以上我们便完成了对爬取元素的分析,在下面我们开始准备爬取工作

03_爬虫入门级教程_如何进行数据爬取?

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

周偏偏偏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值