python网络爬虫与数据采集

最新推荐文章于 2025-03-14 17:53:23 发布

万物皆非

最新推荐文章于 2025-03-14 17:53:23 发布

阅读量689

点赞数

分类专栏：爬虫文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/qq_51683259/article/details/124646844

版权

爬虫专栏收录该内容

1 篇文章

订阅专栏

python网络爬虫与信息提取

Requests库的安装

requests库是python爬取网页的第三方库。特点是简单而且简洁。
安装requests库之后在pycharm集成编译器中进行测试，查看百度网页的状态码：

import requests

r = requests.get(url="http://www.baidu.com")
print(r.status_code) #查看状态码
#200

在这里插入图片描述

Requests库的get方法

r=requests.get(url) 构造一个向服务器请求资源的Request对象，返回一个包含服务器资源的Response对象。Response对象包含从服务器返回的所有资源。完整参数如下：
在这里插入图片描述
Request对象和Response对象是两个最重要的对象。其中Response对象是最重要的对象，包含了爬虫得到的网页中的全部内容。