python 2.x中的urlparse模块(或python 3.x中的urllib.parse)将是执行此操作的方式.
>>> from urllib.parse import urlparse
>>> url = 'http://example.com/random/folder/path.html'
>>> parse_object = urlparse(url)
>>> parse_object.netloc
'example.com'
>>> parse_object.path
'/random/folder/path.html'
>>> parse_object.scheme
'http'
>>>
如果您想在URL下的文件路径上进行更多的工作,可以使用posixpath模块:
>>> from posixpath import basename, dirname
>>> basename(parse_object.path)
'path.html'
>>> dirname(parse_object.path)
'/random/folder'
之后,您可以使用posixpath.join将部件粘合在一起.
编辑:我完全忘记了windows用户将会阻塞在os.path中的路径分隔符.我读了posixpath模块文档,它有一个特殊的URL操作参考,所以一切都很好.