python网络爬虫--Requests库（3）

最新推荐文章于 2020-10-23 08:42:48 发布

太原浪子

最新推荐文章于 2020-10-23 08:42:48 发布

阅读量86

点赞数

分类专栏： Python网络爬虫

本文链接：https://blog.csdn.net/u010671028/article/details/109027953

版权

Python网络爬虫专栏收录该内容

18 篇文章 3 订阅

订阅专栏

一、 requests.get(url, params=None, **kwargs)

import requests

url = "https://movie.douban.com/subject/26754233/reviews?start=%d"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36"
}

for i in range(20):
    response = requests.get(url % i * 20, headers=headers)

    with open("%d.html" % i, "w", encoding="utf-8") as f:
        f.write(response.text)
        f.flush()

二、response属性和方法

1.1 属性

属性	描述
cookies	服务器返回给客户端的
elapsed
encoding	编码
headers	响应头
history	历史
raw	资源
reason	错误原因
request	对哪个请求的响应
status_code	状态码、响应码
url	对哪个地址的响应

状态码：

2XX
- 成功
- 200
- 201
- 3XX
- 重定向
- 4XX
- 客户端错误
- 5XX
- 服务器内部错误

1.2 方法

变成属性的方法

方法	描述
ok
is_redirect	是否重定向
is_prmanent_redirect	是否永久重定向
next	重定位时下一个地址
apparent_encoding	编码
content	内容
text	文本内容，将内容作为文本格式
links	链接

成员方法

方法	描述
close
raise_for_status
json
iter_lines
iter_content

太原浪子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python网络爬虫--Requests库（3）

一、 requests.get(url, params=None, **kwargs)import requestsurl = 'https://www.csdn.net/'response = requests.get(url)print(response) # <Response [200]>，只打印状态码print(response.text) # 输出响应的内容二、response属性和方法1.1 属性属性描述cookies服务器返回给客户
复制链接

扫一扫