python处理URL带中文无法通过ascii 编码问题 -《狗嗨默示录》-

最新推荐文章于 2024-11-13 17:24:18 发布

weixin_30296405

最新推荐文章于 2024-11-13 17:24:18 发布

阅读量176

点赞数

文章标签： python 爬虫 php

原文链接：http://www.cnblogs.com/LiGoHi/p/7286556.html

版权

因为url中含有中文调试了一中午，饭都忘吃了，最后终于知道怎么处理URL带中文无法通过ascii 编码的情况了。

通过了解urllib.parse.quote()，发现它完全可以直接处理中英混排的URL。

import urllib.parse

url = 'http://www.example.com/api.php?text=中文'

# 不带附加参数 print('\n不带附加参数：\n%s' % quote(url))

# 附带不转换字符参数 print('\n附加不转换字符参数：\n%s' % quote(url, safe='/:?='))

运行结果：

不带附加参数：

http%3A//www.example.com/api.php%3Ftext%3D%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附加不转换字符参数：

http://www.example.com/api.php?text=%E4%B8%AD%E6%96%87%E5%9C%A8%E8%BF%99%E9%87%8C

附：
quote可用的参数如下：

quote(string, safe='/', encoding=None, errors=None)

其中的safe参数可用的范围：

reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

通过设置合适的参数即可对爬取来的混合中文的URL进行直接处理了。

转载于:https://www.cnblogs.com/LiGoHi/p/7286556.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30296405

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Minillama3-＞sft训练

liguandong

06-21

142

SFT数据集分别为：[generated_chat_0.4M](https://huggingface.co/datasets/BelleGroup/generated_chat_0.4M)、[train_0.5M_CN](https://huggingface.co/datasets/BelleGroup/train_0.5M_CN)和[train_2M_CN](https://huggingface.co/datasets/BelleGroup/train_2M_CN)，清洗后剩余约137万行。

产品沉思录精选：如何管理需求优先级 | RICE方法

ProductThinking · 产品沉思录

02-11

1390

虎年的第一期产品沉思录精选，是去年看到很想推荐的关于如何判断需求优先级的方法论。这是一种理念上的变化，但是可能落地到工作实践中会有些难度。没关系，在新的一年知道了还存在另一种经过认真思考的...

参与评论您还未登录，请先登录后发表或查看评论

Python 中文编码问题 ascii‘ codec can‘t encode characters in position

wozaizhe55

01-01

1722

文章目录问题背景ascii' codec can't encode characters in position问题背景解决方案问题分析utf8 codec can't decode byte 问题解决方案问题分析参考问题背景最近项目需要进行接口压力测试，需要监控服务器资源。本着程序员的懒人思维想到了自动化测试、自动监测全链路服务器资源。python 作为脚本语言，在跟shell 交互方面有着得天独厚的优势，于是乎采用 python 在 jmeter 执行测试之前通过 socket 通信告知全链路服务器

python3中url中文转ascii码的介绍

python菜菜~博客

05-08

1930

以百度为例，一般都会在url后面有?wd=**** 的这种，但是往往我们复制下来以后就会显示%253D%25E4%25B8%这种格式，这是什么原因呢，原因就在于计算机其实是不识别我们输入的中文，需要把中文转码成ascii来让计算机识别，下面就带大家来了解一下如何手动让中文转ascii。 import urllib.request import urllib.parse import string ...

也谈 Python 的中文编码处理

in355hz

05-07

420

最近业务中需要用 Python 写一些脚本。尽管脚本的交互只是命令行 + 日志输出，但是为了让界面友好些，我还是决定用中文输出日志信息。很快，我就遇到了异常： UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128) 为了解决...

URl中文转ASCII

weixin_30337157的博客

10-15

240

编码 System.Web.HttpUtility.UrlEncode("中国", System.Text.Encoding.GetEncoding("GB2312")) View Code 解码 System.Web.HttpUtility.UrlDecode("%d6%d0%b9%fa", System.Text.Encoding.GetEncoding(...

python 中文url编码处理

weixin_33910434的博客

03-01

255

可以直接处理中英混排的urlfrom urllib.parse import quote （python3）from urllib import quote (python2) url = 'http://www.baidu.com?search=中文在这里' 不带附加参数 print('\n不带附加参数：\n%s' % quote(url)) 附带不转换字符参数 print('\n附加...

PS3中文游戏合集下载

热门推荐

灵魂秋水

02-20

1万+

PS3中文游戏合集下载

(PS)賭博黙示録カイジ汉化笔记（三）

yusjoel的专栏

11-07

1504

三．文本导出和导入A 这一部分称为A，是因为我最早是用了一个工具进行文本导出和导入。这仅是用来实验，最后我还是编程导出了文本，这个部分放到B来描述。A和B部分都是独立，并不是上下篇。 文本导出导入工具也有不少，oz01的文章中推荐的是CrystalScript、菜鸟工具，我这里推荐一下蓝山魔导，同样是蓝山老妖的作品，将很多工具进行了合成，界面也比较友好。虽然有部分bug，也停止了更新，但还是推荐。 蓝山魔导的使用参考说明书，

疯狂Java程序员基本修养PDF

02-13

《疯狂 java 程序员的基本修养》归纳了java学习者、工作者在学习、工作过程中最欠缺的技术短板，本书把java编程中的重点、要点、难点、常见陷阱收集在一起，旨在帮助读者重点突破这些看似“司空见惯”的基本功。

对python中url参数编码与解码的实例详解

12-31

一、简介在python中url，对于中文等非ascii码字符，需要进行参数的编码与解码。二、关键代码 1、url编码对字符串编码用urllib.parse包下的quote(string, safe=’/’, encoding=None, errors=None)方法。对json格式的参数名和值编码，用urllib.parse包下的 urlencode(query, doseq=False, safe=”, encoding=None, errors=None, quote_via=quote_plus)方法。 2、url解码解码用urllib.parse包下的unquote(stri

URL中如果含有中文等非ASCII字符

02-04

小结：解决方案： 1、URL中如果含有中文等非ASCII字符，则浏览器会对它们进行URLEncode。为了避免浏览器采用了我们不希望的编码，所以最好不要在URL中直接使用非ASCII字符，而采用URL Encode编码过的字符串%. 比如： URL： http://localhost:8080/example/中国?name=中国建议： URL： http://localhost:8080/example/%D6%D0%B9%FA?name=%D6%D0%B9%FA

python中文与url编码之间的相互转换

10-12

4415

中文转换城url编码 from urllib.parse import quote s = '例子' print(quote(s)) 输出：%E4%BE%8B%E5%AD%90 url编码转换成中文 from urllib.parse import unquote unquote("%E4%BE%8B%E5%AD%90", encoding="GBK") 输出：例子

URL的编码解码(一)，仅针对ASCII码字符

m0_57158496的博客

06-09

1021

这段代码提供了一个简单的URL解码实现，可以处理包含十六进制编码字符的URL。它首先定义了一个辅助函数来解码单个字符，然后使用这个函数来解码整个URL字符串。

字符编码

xtggbmdk的博客

02-02

371

转载https://www.cnblogs.com/hukey/p/9647291.html 1.编码: ascii码: 不支持中文 .python2使用的编码是支持,英文,数字,符号 8位一个字节 gbk编码国标: 支持: 中文,英文,数字,符号英文16位中文16位 unicode 万国码支持:中文,英文,数字,符号英文 32位,四个字节中文 32位,四个字节 utf -...

解决'ascii' codec can't encode character

chqj_163的专栏

04-19

1万+

问题下午写实验代码时，遇见一个错误。 Traceback (most recent call last): File “/home/kang/坚果云_windows/final_paper/code/genetic_enhancement/workspace/src/network_analysis/preprocess.py”, line 54, in get_feature print...

python3遇到中文编码‘ascii‘ codec can‘t encode characters 的问题

hjxu2016的博客

04-01

8379

制作好Docker镜像，上传到服务器上，然后遇到 UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 39-45: ordinal not in 中文编码错误的问题。记录一下解决方案：在python2中，也遇到过此问题，当时博主只在python脚本中添加 import sys reload(sys) sys.setdefaultencoding('utf-8') 但是，楼主是在 python3中遇到这个问题，

python中文转换url编码（转）

weixin_33676492的博客

10-06

599

今天修改一个天气预报的东西，但输入城市不能得到天气预报，感觉是编码不对，因为你输入一个城市（比如‘杭州’），url的地址编码却是'%E4%B8%BD%E6%B1%9F'，因此需要做一个转换。这里我们就用到了模块urllib。>>> import urllib>>> data = '杭州'>>> print data杭州&...

ks8 本地化部署 F5-TTS