url部件 | 描述 |
port_sch | 网络协议或下载规划 |
net_loc | 服务器位置 |
path | /限定文件 |
params | 可选参数 |
query | 链接符&键值对 |
frag | 拆分文档特俗符 |
网络定位符net_loc
user/password/host:port ,一般代理网关user和password都是匿名的,host和port是主要的。
urlparse模块
urlpare提供了操作url基本功能的操作。这些功能包括urlparse(),urlunparse(),urljion()
>>> i= urlparse.urlparse('http://www.cnblogs.com/huangcong/archive/2011/08/31/2160633.html')
>>> print i
ParseResult(scheme='http', netloc='www.cnblogs.com', path='/huangcong/archive/2011/08/31/2160633.html', params='', query='', fragment='')
>>> p =urlparse.urlunparse(i)
>>> print p
http://www.cnblogs.com/huangcong/archive/2011/08/31/2160633.html
urlparse.urljion(oldstrurl,newurlstr,allowforg=none)