import requests
# python内部的包 可以直接 import
# requests 不是python自带的包 那么我们需要安装
# 方式1:鼠标移动到包名上,根据提示安装 要写对包名
# 方式2:在 cmd 中 pip install requests
# 伪装成用户访问网页
# 请求头:User-Agent 模拟/伪装成浏览器
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'
}
# http协议:
# 先请求request,后响应response
# 状态码:
# 200 成功
# 4xx 客户端的错误
# 5xx 服务器的错误
response = requests.get('https://www.baidu.com', headers=headers)
print(response) # <Response [200]>
# print(response.text) # 字符串
# print(response.content) # 二进制/字节类型 b'hello'
# print(response.json()) # json 解析 : 字符串 ==> 字典 将采集到的字符串解析为字典形式
import requests
# python内部的包 可以直接 import
# requests 不是python自带的包 那么我们需要安装
# 方式1:鼠标移动到包名上,根据提示安装 要写对包名
# 方式2:在 cmd 中 pip install requests
# 伪装成用户访问网页
# 请求头:User-Agent 模拟/伪装成浏览器
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'
}
# http协议:
# 先请求request,后响应response
# 状态码:
# 200 成功
# 4xx 客户端的错误
# 5xx 服务器的错误
response = requests.get('https://www.baidu.com', headers=headers)
print(response) # <Response [200]>
# print(response.text) # 字符串
# print(response.content) # 二进制/字节类型 b'hello'
# print(response.json()) # json 解析 : 字符串 ==> 字典 将采集到的字符串解析为字典形式