Python爬虫页面解析基础：url编码本质

最新推荐文章于 2022-09-08 23:07:18 发布

学习-永无止境

最新推荐文章于 2022-09-08 23:07:18 发布

阅读量101

点赞数

分类专栏： Python零基础学习教程文章标签： Python Python爬虫 Python基础 Python3 网络爬虫

本文链接：https://blog.csdn.net/weixin_45974628/article/details/103529212

版权

Python零基础学习教程专栏收录该内容

79 篇文章 4 订阅

订阅专栏

url编码本质

其实url本质就是将中文字符串进行utf8编码,然后得到编码后的对象转换字符串去掉开头的b'以及末尾的',然后再将\x转换成%,再将里面内容x变成e最后将字符串小写变成大写

举例

#拿我举例

#第一步进行编码
a= '我'
a= a.encode('utf8')

#第二步进行转字符串去除头尾
a = str(a).strip("b'") #strip里面的值不是匹配而是有无

#第三步将\转换成%
a = a.replace('\\','%')

#第四部将x写变成e
a = a.replace('x','e')

#第五步将小写变成大写
a = a.upper()

#一步到位
a=str(a.encode('utf8')).strip("b'").replace('\\x','%').replace('x','e').upper()

#结果%E6%88%91

#不行你可以访问 https://www.baidu.com/s?wd=%E6%88%91,https://www.baidu.com/s?wd=我
#看看是不是一样


推荐Python大牛在线分享技术 扣qun：855408893

领域：web开发，爬虫，数据分析，数据挖掘，人工智能

python中调用库进行url编码和解码

from urllib import parse

编码

str1 = '我'
str2 = parse.quote(str1)
print(str2)
#%E6%88%91

解码

str1 = '%E6%88%91'
str2 = parse.unquote(str1)
print(str2)
#我

学习-永无止境

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫页面解析基础：url编码本质

url编码本质其实url本质就是将中文字符串进行utf8编码,然后得到编码后的对象转换字符串去掉开头的b'以及末尾的',然后再将\x转换成%,再将里面内容x变成e最后将字符串小写变成大写举例#拿我举例#第一步进行编码a= '我'a= a.encode('utf8')#第二步进行转字符串去除头尾a = str(a).strip("b'") #strip里面的值不是匹配而是有无...
复制链接

扫一扫