【Python_urllib学习笔记(一)】urllib.request模块的基本用法

urllib.request模块的基本用法

前言

此篇文章中介绍urllib库中request模块的基本用法,包括发送HTTP请求、获得服务器响应、请求头重构等。

正文

urllib库

1、urllib库是Python内置的HTTP请求库,不需要单独安装;
2、urllib库有4个模块,其中request模块 是最基本的HTTP请求模块,作用是向网站发请求,即模拟在浏览器输入地址访问网站;
3、urllib.request 模块主要用到了以下的方法。

3.1 urllib.request.urlopen()方法

request.urlopen()方法 : 向网站发起请求并获取响应对象,返回一个 HTTPResponse 类型的对象。
参数:
url:需要爬取的url地址,必选参数,是一个 字符串 或 Request对象;
timeout:设置等待超时时间,指定时间内未响应抛出超时异常。
响应对象方法:
read() : 返回bytes类型;
geturl():返回实际数据的url地址;
getcode():返回HTTP的响应码。
应用实例:
向百度 http://www.baidu.com/发起请求并获取百度响应内容

from urllib import request

res = request.urlopen(url="http://www.baidu.com/")  # 返回响应对象
html = res.read().decode()  # decode():转换为字符串类型
url = res.geturl()
code = res.getcode()

print(html)
print(url)
print(code)  # 200:响应成功

3.2 urllib.request.Request()方法

urllib.request.Request()方法:主要用于构造一个 url,返回一个 urllib.request.Request 对象。
通过request.urlopen()方法,向网站发送请求,请求头默认为: “User-Agent”: “Python-urllib/3.8” ,有些网站的反爬虫机制不允许python直接访问,所以需要伪装请求头。
“User-Agent”:可以直接百度 “User-Agent大全” 获取。
参数:
url:请求的url地址,必选参数;
headers:添加请求头,类型为字典headers={“User-Agent”:" "}。
使用流程:
from urllib import request
构造请求对象 :req=request.Request(url=url,headers=headers)
获取响应对象 :res=request.urlopen(req)
获取响应内容 :html=res.read().decode()
应用实例:
向测试网站:http://httpbin.org/get 发请求,从响应内容中确认 User-Agent

from urllib import request

url = "http://httpbin.org/get" # 请求的url地址
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko)"} # 请求的User-Agent 
req = request.Request(url=url, headers=headers)  # 包装请求对象
res = request.urlopen(req)  # 发请求
html = res.read().decode() # 获取响应内容
print(html)
{
  "args": {}, 
  "headers": {
    "Accept-Encoding": "identity", 
    "Host": "httpbin.org", 
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko)", 
    "X-Amzn-Trace-Id": "Root=1-63da1945-7c38c759080100c9130dab95"
  }, 
  "origin": "223.80.102.182", 
  "url": "http://httpbin.org/get"
}

从print内容中可以看到,“User-Agent” 已经重构为 Chrome(Win7)浏览器:

 "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko)"
  • 3
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

禾戊之昂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值