Python 利用爬虫爬取网页内容（div节点的疑惑）

最新推荐文章于 2024-04-30 13:12:03 发布

Manner_maketh_Man

最新推荐文章于 2024-04-30 13:12:03 发布

阅读量5.9k

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Manner_maketh_Man/article/details/89162336

版权

Python 利用爬虫爬取网页内容（div节点的疑惑）
最近在写爬虫的时候发现利用beautifulsoup解析网页html

利用解析结果片段为：

2018-05-18(美国) / 瑞恩·雷诺兹 / 乔什·布洛林 / 莫蕾娜·巴卡林 / 朱利安·迪尼森 / 莎姬·贝兹 / T·J·米勒 / 莱斯利·格塞斯 / 卡兰·索尼 / 布里安娜·希德布兰德 / 杰克·凯西 / 埃迪·马森 / 忽那汐里 / 斯蒂芬·卡皮契奇 / 兰德尔·瑞德...

7.5 (94247人评价)

我要抓取的是评分，也就是上文中：7.5

利用find_all('节点‘，class_=‘目标class’)

在之前抓取的时候，经常将“”这个符号也写入目标class中，并且认为要加入转义符号r‘’以去消除转义

但经常返回的是空字符串

之后看到了其他博客后发现，不用加入“”也可以（若是加入“”后应该注意r’'的使用）

源代码为：

复制代码
import re
import requests
from bs4 import BeautifulSoup

def get_HTML(url):
heade

最低0.47元/天解锁文章

Manner_maketh_Man

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python 利用爬虫爬取网页内容（div节点的疑惑）

Python 利用爬虫爬取网页内容（div节点的疑惑）最近在写爬虫的时候发现利用beautifulsoup解析网页html利用解析结果片段为：死侍2/ DP22018-05-18(美国) / 瑞恩·雷诺兹 / 乔什·布洛林 / 莫蕾娜·巴卡林 / 朱利安·迪尼森 / 莎姬·贝兹 / T·J·米勒 / 莱斯利·格塞斯 / 卡兰·索尼 / 布里安娜·希德布兰德 / 杰克·凯西 / ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。