Python中的urllib模块是一个用于处理URL的库,它提供了一些功能,
如打开和读取URL、解析URL等。以下是urllib模块的一些常用功能:
- 打开URL
使用urlopen()函数打开一个URL,返回一个URL对象。
from urllib.request import urlopen
url = 'https://www.example.com'
response = urlopen(url)
content = response.read()
print(content)
- 解析URL
使用urlparse()函数解析URL,返回一个6元组,包含scheme、netloc、path、params、query和fragment。
from urllib.parse import urlparse
url = 'https://www.example.com/path?query=value#fragment'
parsed_url = urlparse(url)
print(parsed_url)
- 发送HTTP请求
使用Request类创建一个请求对象,然后使用urlopen()函数发送请求。
from urllib.request import Request, urlopen
url = 'https://www.example.com'
req = Request(url)
response = urlopen(req)
content = response.read()
print(content)
- 处理URL编码
使用quote()函数对URL进行编码,使用unquote()函数对URL进行解码。
from urllib.parse import quote, unquote
url = 'https://www.example.com/测试'
encoded_url = quote(url)
print(encoded_url)
decoded_url = unquote(encoded_url)
print(decoded_url)