【网页爬虫】前端网页入门之py中使用BeautifulSoup爬取本地网页（三）

最新推荐文章于 2021-04-17 17:00:52 发布

jessica__lu

最新推荐文章于 2021-04-17 17:00:52 发布

阅读量635

点赞数

分类专栏：网页基础文章标签：网页基础信息获取网页爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jessica__lu/article/details/85933835

版权

本文是作者作为新手的爬虫练习，利用BeautifulSoup解析本地网页，提取图片、标题、价格、评论数和星星数量（星级）。重点介绍了如何识别并获取星星数量，通过观察网页结构，使用nth-of-type(2)选择器，并用find_all()方法解决问题。文章最后展示了实践效果，并预告将尝试在实际网页中爬取数据。

摘要由CSDN通过智能技术生成

继昨天学习在本地截取网页信息之后，决心做个小练习巩固一下自己，在练习的过程中不但回顾了一下昨天所学知识，并且发现一些小小的新知识点记录下来~
萌新一枚，如有不对，大神们轻喷！！！

正文开始~

今日练习目标：沿袭昨天使用BeautifulSoup的套路，对这个网页的图片，标题，价格，评论数，星级进行获取
难点发现：对于星星颗数的获取（就是自动识别点亮了几个星星）
在这里插入图片描述

因每颗星星都对应着一行代码，图片中的五颗星星就对应了五行代码，
为了让其通过一行代码就显示，观察网页，多取几颗星星的selector发现规律：
从父节点开始取，此处保留：nth-of-type（2）
在这里插入图片描述

接下来就是今天疑惑的难点，对于星星数量的获取
此处使用find all（）方法来解决
在这里插入图片描述

由此再加上昨天的学习内容
解析本地网页&#x

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。