python requests返回值为200 但是text无内容_Python爬虫是如何抓取并储存网页数据的？...

最新推荐文章于 2024-07-09 16:13:39 发布

weixin_39727706

最新推荐文章于 2024-07-09 16:13:39 发布

阅读量3.4k

点赞数

文章标签： python requests返回值为200 但是text无内容 python网页抓取实例爬虫div下的中文怎么提取爬虫数据抓取

本文链接：https://blog.csdn.net/weixin_39727706/article/details/111291078

版权

本文通过一个Python爬虫实例讲解了当requests返回状态码200但获取不到内容的问题，以及如何解析网页、提取div下的中文内容，并介绍了数据抓取的基本流程和存储方法，以B站视频热榜为例。

摘要由CSDN通过智能技术生成

爬虫是Python的一个重要的应用，使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据，本文将基于爬取B站视频热搜榜单数据并存储为例，四个步骤详细介绍Python爬虫的基本流程。

Step 1

请求尝试

首先进入b站首页，点击排行榜并复制链接。

https://www.bilibili.com/ranking?spm_id_from=333.851.b_7072696d61727950616765546162.3

启动 Jupyter notebook ，并运行以下代码：

import requests

url = 'https://www.bilibili.com/ranking?spm_id_from=333.851.b_7072696d61727950616765546162.3'
res = requests.get('url')
print(res.status_code)
#200

在上面的代码中，完成下面三件事：

导入requests
使用get方法构造请求
使用status_code获取网页状态码

可以看到返回值是 200 ，表示服务器正常响应，这意味着我们可以继续进行。

Step 2

解析页面

在上一步我们通过requests向网站请求数据后࿰

最低0.47元/天解锁文章

weixin_39727706

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫