python的urlparse

最新推荐文章于 2021-08-21 21:52:08 发布

凡夫俗子66

最新推荐文章于 2021-08-21 21:52:08 发布

阅读量357

点赞数

分类专栏： Python

Python 专栏收录该内容

29 篇文章 0 订阅

订阅专栏

urlparse主要是URL的分解和拼接，分析出URL中的各项参数，可以被其他的URL使用。

主要的函数有：

1、urlparse

将URL分解为6个片段，返回一个元组，包括协议、基地址、相对地址等等

import urlparse

url = urlparse.urlparse('http://blog.csdn.net/?ref=toolbar')

print url

输出结果为：

ParseResult(scheme='http', netloc='blog.csdn.NET', path='/', params='', query='ref=toolbar', fragment='')

scheme是协议，netloc是服务器地址，path是相对路径，params是参数，query是查询的条件。

如果知道服务器的地址的话，可以以服务器的地址为基地址，拼接其他的相对路径，组成新的URL。

2、urlsplit

和urlparse的作用差不多，将URL分解为5个片段，返回一个元组。返回一个包含5个字符串项目的元组：协议、位置、路径、查询、片段。

import urlparse
url = urlparse.urlsplit('http://blog.csdn.net/?ref=toolbar')
print url

运行结果为：

SplitResult(scheme='http', netloc='blog.csdn.net', path='/', query='ref=toolbar', fragment='')

3、urljoin

基地址和相对地址的拼接。

这个函数比较复杂，不同的数据得出的结果大不一样，而且容易出现错误，不建议用这个函数

urlparse.urljoin(base, url[, allow_fragments])

4、urlunparse

和urlparse的效果相反，可以把6个部分拼接起来。

urlparse.urlunparse(data)

返回一个string

例子：

import urlparse
url = "https://www.google.com.hk:8080/home/search;12432?newwi.1.9.serpuc#1234"
r = urlparse.urlparse(url)
print r
print r.port,r.hostname
print r.geturl()
r = urlparse.urlsplit(url)
print r
parts = ["http","www.facebook.com","/home/email","132","parts","md5=?"]
print urlparse.urlunparse(parts)
print urlparse.urlunsplit(parts[0:5])

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。