Python3 urllib.parse

最新推荐文章于 2024-08-17 13:38:49 发布

静妍

最新推荐文章于 2024-08-17 13:38:49 发布

阅读量1.9k

点赞数

分类专栏： Python Python爬虫文章标签： python urllib.parse

本文链接：https://blog.csdn.net/xfyangle/article/details/61616362

版权

Python 同时被 2 个专栏收录

80 篇文章 4 订阅

订阅专栏

Python爬虫

18 篇文章 0 订阅

订阅专栏

urllib.parse分为URL parsing and URL quoting，即网址解析和网址引用。

URL解析函数专注于将URL字符串拆分为其组件，或将URL组件组合到URL字符串中。

urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)

>>> from urllib.parse import urlparse
>>> o = urlparse('http://www.cwi.nl:80/%7Eguido/Python.html')
>>> o   
ParseResult(scheme='http', netloc='www.cwi.nl:80', path='/%7Eguido/Python.html',
            params='', query='', fragment='')
>>> o.scheme
'http'
>>> o.port
80
>>> o.geturl()
'http://www.cwi.nl:80/%7Eguido/Python.html'

>>> from urllib.parse import urlparse
>>> urlparse('//www.cwi.nl:80/%7Eguido/Python.html')
ParseResult(scheme='', netloc='www.cwi.nl:80', path='/%7Eguido/Python.html',
           params='', query='', fragment='')
>>> urlparse('www.cwi.nl/%7Eguido/Python.html')
ParseResult(scheme='', netloc='', path='www.cwi.nl/%7Eguido/Python.html',
           params='', query='', fragment='')
>>> urlparse('help/Python.html')
ParseResult(scheme='', netloc='', path='help/Python.html', params='',
           query='', fragment='')

urllib.parse.urlsplit(urlstring, scheme='', allow_fragments=True)
使用方法同上

合并URL

urll.parse.urlencode()

urllib.parse.urlunsplit(parts)

urllib.parse.urljoin(base, url, allow_fragments=True)

>>> from urllib.parse import urljoin
>>> urljoin('http://www.cwi.nl/%7Eguido/Python.html', 'FAQ.html')
'http://www.cwi.nl/%7Eguido/FAQ.html'

静妍

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录