urllib库（三）parse模块：quote()/quote_plus()，unquote()/unquote_plus()，quote_from_bytes()

最新推荐文章于 2024-05-13 09:23:04 发布

Eniac-W

最新推荐文章于 2024-05-13 09:23:04 发布

阅读量1.1w

点赞数 4

分类专栏：爬虫学习文章标签：爬虫

本文链接：https://blog.csdn.net/Wjf7496/article/details/109813106

版权

urllib.parse模块在功能上分为两大类：URL parsing(URL解析)和URL quoting(URL引用)
上一节已经介绍了url解析本节介绍url引用
URL解析传送门(https://blog.csdn.net/Wjf7496/article/details/109787586)

(1)quote()/quote_plus()

上一节介绍的urllib.parse.urlencode()函数是对一个字典或者sequence of 'two-tuple'
进行编码
若只是对单个str或者bytes编码则需要使用quote()/quote_plus()

函数定义
urllib.parse.quote(string,safe='/',encoding=None,errors=None)
	string：
		str或bytes型数据
		其中下划线，句号，逗号，斜线和字母数字这类符号不需要转化，其它的则需要转化。
		另外URL不能使用的字符（如中文）前会被加上百分号(%)同时转换成十六进制，即<%xx>的形式
	safe:
		safe字符串包含一些不能转换的字符，默认是斜线(/)。
	encoding、errors：
		这两个参数指定如何处理str.encode()方法接受的非ascii字符
	
二者的区别在于对特殊字符编码的方式不一样 如
	quote()      不编码斜