python3学习笔记 雨痕_Python 3 学习笔记:Requests 基础

caa4dd6b147156b9b7525d1d653a0db8.png

requests 作为一个第三方库,需要使用 pip 工具安装,然后使用 import 语句引入,

import requests

GET 请求

基本实例

HTTP 中最常见的就是 GET 请求,使用 requests 中的 get() 方法就可以向服务器发送一个 GET 请求,

response = requests.get(url)

上面是一个最简单、常见的 GET 请求,其返回一个 Response 对象。

如果需要参数,则可以构造一个参数字典,如:

parameters = { some parameters}response = requests.get(url, params=parameters)

抓取网页

以猫眼的电影榜单为例,抓取前十名的电影名称,

import requestsimport reurl = r'https://maoyan.com/board'def get_file_name():response = requests.get(url=url)files = re.findall(r'(.*?)', response.text, re.I)print(files)if __name__ == '__main__':get_file_name()

这里使用正则表达式匹配电影名称,然后提取出来。

抓取文件

同样可以抓取网页中的图片、音频、视频等,还是以猫眼为例,抓取电影的海报图片,

import requestsimport reurl = r'https://maoyan.com/board'def get_file_name():response = requests.get(url=url)pattern = r'(.*?)'files = re.findall(pattern=pattern, string=response.text, flags=re.I)return filesdef get_file_image():i = 0files = get_file_name()response = requests.get(url=url)pattern = r''imgs = re.findall(pattern=pattern, string=response.text, flags=re.I)for img_url in imgs:image = requests.get(url=img_url).contentwith open(files[i] + '.jpg', 'wb') as file:file.write(image)i = i + 1if __name__ == '__main__':get_file_image()

同样使用正则表达式,提取海报的 url ,然后根据这些 url 向服务器发送请求,将返回的数据(二进制数据),保存图片文件。

添加 headers 信息

有些网站是禁止爬虫的,例如知乎,所以可以传递 headers 参数将爬虫伪装成浏览器。headers 参数是一个字典的形式,类似于url 参数,下面是一个火狐浏览器的 headers 信息,

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0'}

下面是一个 Chrome 的 headers 信息,

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'}

POST 请求

POST 请求主要是用于提交表单数据,用的地方不是很多,因为我们的主要目的是在网上抓取数据。

响应

服务器返回的响应处理 text 和 centent 两个属性,还有很多其他属性,如状态码、响应头、Cookies等,

import requestsresponse = requests.get(url=r'https://maoyan.com/board')print(response.status_code)print(response.headers)print(response.cookies)print(response.url)print(response.history)

◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆◆

为了帮各位观众老爷们快速入门python,我在这里准备了一套“经典入门教程”,这些是入门付费教程哦,现在当做福利免费赠送给各位观众老爷们,私信我“python入门”就可以领取!

点击我的头像关注我进入主页,就能看到私信按钮了。私信我“python入门”,一个字不能多一个字不能少,即可快速领取!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值