python 带中文的URL获取 urlencode&quote

本文介绍了两种将中文转换为适用于URL的格式的方法:使用urlencode进行字典转换和使用quote进行单个字符转换。这两种方法能够帮助解决爬虫在抓取含有中文URL时遇到的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在搞爬虫,需要获取URL,但是URL中包含中文,输入浏览器地址栏能进入网页,但是爬虫却找不到。搜索找到了下面两个将中文字符转换为URL地址字符的方法。

1、字典转换为URL字符串-urlencode

from urllib.parse import urlencode
​​​​​​​
key = urlencode({"key1":"中文1", "key2":"中文2"}) #中文部分也可以使用英文
#最后转换后的形式为:key1=中文1&key2=中文2
#示例
url = https://www.zdic.net/e/sci/index.php?
key = urlencode({"field":"0", "classid":"8", "keyboard":"护国"})
fullURL = url + key  # 完整url

#fullURL: https://www.zdic.net/e/sci/index.php?field=0&classid=8&keyboard=%E6%8A%A4%E5%9B%BD

2、单个字符转换为URL字符串-quote

from urllib.parse import quote
​​​​​​​
key = quote("中文") #中文部分也可以使用英文
#最后转换后的形式为:中文
#示例
url = "https://www.zdic.net/hans/"
key = quote("安土重迁")
fullURL = url + key  # 完整url

#fullURL: https://www.zdic.net/hans/%E5%AE%89%E5%9C%9F%E9%87%8D%E8%BF%81

Over!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值