urlparse
urlparse主要是URL的分解和拼接,分析出URL中的各项参数,其主要的函数如下
urlparse
主要将url分解成6个片段,返回一个包括6个片段的对象
- scheme:协议
- netloc:服务器地址
- path:服务器的相对地址
- params:参数
- query:查询条件
- fragment:片段
import urlparse
url=urlparse.urlparse('http://blog.csdn.net/pupoqian3720/name=hou')
print url
# 结果
ParseResult(scheme='http', netloc='blog.csdn.net', path='/pupoqian3720/name=hou', params='', query='', fragment='')
parse_qs
- urlparse.parse_qs 返回字典
- urlparse.parse_qsl 返回列表
import urlparse
url=urlparse.urlparse('http://blog.csdn.net/pupoqian3720/?name=hou')
print url.query
# 字典
query1 = urlparse.parse_qs(url.query)
print query1,type(query1)
# 列表
query2 = urlparse.parse_qsl(url.query)
print query2,type