python爬虫requests的基本使用

1、安装requests库

reqests是python的第三方库,使用前需要安装好requests库

使用pip3j进行安装

pip3 instaall requests

2、GET请求

使用get()方法进行发送get请求
import requests

resp = requests.get('https://www.httpbin.org/get')

print(resp.text)           # 打印请求响应
print(resp.status_code)    # 返回求情页面的状态码
带参数的get请求

1、直接构建请求的url

import requests

resp = requests.get('https://www.httpbin.org/get?name=germey&age=15')
print(resp.text)

2、将参数以字典的形式传给get方法的params参数

import requests

data = {
    'name': 'germey',
    'age': '15'
}
resp = requests.get('https://www.httpbin.org/get', params=data)
print(resp.text)
添加header请求头

在发送请求的时候一般会有一个请求头Request Header,某些网站会检测请求头信息,识别请求是否是一个正常浏览器发送的,如果检测到不是正常的浏览器发出的,则会返回异常结果,导致页面抓取失败

import requests

# 添加User-Agent字段
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/"
}
resp = requests.get("https://ssr1.scrape.center/", headers=header)
print(resp.text)

3、post请求

使用post() 发送post请求
import requests

data = {
    'name': 'germey',
    'age': 15,
}
resp = requests.post('https://www.httpbin.org/post', data=data)
print(resp.text)

4、响应

请求发送后,会得到响应,可以使用text(返回字符串数据)和content(返回二进制数据)获取响应的内容 ,还可以使用其他属性、方法来获得其他信息,比如状态码(status_code)、响应头(headers)、Cookie等

import requests

resp = requests.get('https://www.httpbin.org/get')

print(resp.text)            # 返回html页面(字符串数据)
print(resp.content)         # 返回二进制数据
print(resp.status_code)     # 返回响应的状态码
print(resp.cookies)         # 返回响应的Cookie,返回的数据类型为RequestsCoolieJar对像
print(resp.headers)         # 返回响应的头部信息
print(resp.url)             # 返回响应的url
print(resp.history)         # 得到请求历史
补充

requests 库提供一个内置的状态码查询对象 requests,codes

import requests

resp = requests.get('https://www.httpbin.org/get')
exit() if not resp.status_code == requests.codes.ok else print('request successfully')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值