自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_52186223的博客

爬虫

关注

文章平均质量分 92

关注数：文章数：1 文章阅读量：109 文章收藏量：1

作者: NONE-C

24届双非本，自动驾驶算法工程师

展开

爬虫学习笔记

爬虫爬取网页，Requests爬取网站，Scrapy爬取全网,大规模，搜索引擎类人行为可以不遵守robots协议request包含Response和Request两个对象其中，Response包含：属性说明r.status_codeHTTP请求的返回状态，200表示连接成功，404表示失败r.textHTTP响应内容的字符串，即，url对应的页面内容r.encoding从HTTP header中猜测的响应内容编码方式r.appare

原创 2021-08-22 21:15:10 · 109 阅读 · 0 评论