利用Python库urllib.parse可以很方便地帮助我们对URL路径进行解析、拆分。
示例代码如下:
# -*- coding: utf-8 -*-
import urllib.parse as urlparse
path = 'http://example.com/search?q=python+programming&num=10'
url = urlparse.urlparse(path)
运行结果如下:
从上面的运行结果我们可以看出:
成员池数urlparse()会对URL路径字符串“urlparse”进行解析,得到了一ParseResult 对象,这个对象把URL路径进行了分析和拆解。
如果我们把 path 换成是:
'/search?q=python+programming&num=10'
我们可以看一下又是怎么样的效果。
代码如下:
# -*- coding: utf-8 -*-
import urllib.parse as urlparse
path = '/search?q=python+programming&num=10'
url = urlparse.urlparse(path)
运行结果如下:
可见成员函数urlparse()还是挺智能的,它能知道哪些是属于hostname,哪些是属于path,哪些是属于query。