Python 处理 URL 编码与解码（urllib.parse）

思想实验室Tb

于 2025-03-29 10:25:56 发布

阅读量273

点赞数 5

文章标签： python 数据库 java

本文链接：https://blog.csdn.net/2501_91160979/article/details/146641015

版权

```html Python 处理 URL 编码与解码（urllib.parse）

Python 处理 URL 编码与解码（urllib.parse）

在现代 Web 开发中，URL 是我们与服务器进行交互的重要工具之一。无论是发送请求还是处理响应，URL 的正确编码和解码都是确保数据传输准确性的关键步骤。Python 提供了一个强大的库 urllib.parse，它可以帮助开发者轻松地对 URL 进行编码和解码操作。

什么是 URL 编码？

URL 编码（也称为百分号编码）是一种将非 ASCII 字符或特殊字符转换为可安全传输的格式的方法。例如，空格通常会被编码为 %20，而其他字符如 &、= 和 / 也会被编码以避免它们被解释为 URL 的分隔符。

在 Python 中，我们可以使用 urllib.parse.quote() 函数来实现 URL 编码。下面是一个简单的例子：


import urllib.parse

# 原始字符串
original_string = "Hello World! This is a test."

# URL 编码
encoded_string = urllib.parse.quote(original_string)

print("原始字符串:", original_string)
print("编码后的字符串:", encoded_string)

运行上述代码后，输出结果将是：

原始字符串: Hello World! This is a test.
编码后的字符串: Hello%20World%21%20This%20is%20a%20test.

什么是 URL 解码？

与编码相反，URL 解码是将编码后的字符串还原为其原始形式的过程。在 Python 中，可以使用 urllib.parse.unquote() 函数来完成这一任务。


import urllib.parse

# 编码后的字符串
encoded_string = "Hello%20World%21%20This%20is%20a%20test."

# URL 解码
decoded_string = urllib.parse.unquote(encoded_string)

print("编码后的字符串:", encoded_string)
print("解码后的字符串:", decoded_string)

运行上述代码后，输出结果将是：

编码后的字符串: Hello%20World%21%20This%20is%20a%20test.
解码后的字符串: Hello World! This is a test.

更复杂的 URL 操作

除了基本的编码和解码功能外，urllib.parse 还提供了许多其他有用的工具来解析和操作 URL。例如，我们可以使用 urlparse() 函数来拆分一个完整的 URL，并提取出它的各个部分。


from urllib.parse import urlparse

# 完整的 URL
url = "https://www.example.com/path/to/resource?query=value#fragment"

# 解析 URL
parsed_url = urlparse(url)

print("解析后的 URL:", parsed_url)

运行上述代码后，输出结果将是：