Urlparse这个第三方模块中包含的函数有urljoin、urlsplit、urlunsplit、urlparse等。
1.urlparse.urlparse(urlstring[, scheme[, allow_fragments]])
urlparse将urlstring解析成6个部分,它从urlstring中取得URL,并返回元组 (scheme, netloc, path, parameters, query, fragment),但是实际上是基于namedtuple,是tuple的子类。它支持通过名字属性或者索引访问的部分URL,每个组件是一串字符,也有可能是空的。组件不能被解析为更小的部分,%后面的也不会被解析,分割符号并不是解析结果的一部分,除非用斜线转义,注意,返回的这个元组非常有用,例如可以用来确定网络协议(HTTP、FTP等等 )、服务器地址、文件路径,等等。如下图所示
(1)引入urlparse模块,这里只引入了urlparse方法,如果你想要用所有的方法,你需要import urlparse
from urlparse import urlparse
(2)我们将下面的url地址进行拆解,将拆解的结果存放到parsed中.
parsed=urlparse('http://