Python URLparse模块

url(UniformResourceLocator)中文叫统一资源定位符,是互联网上用来标识某一处资源的地址。
协议标准如下:
scheme://domain:port/path?query_string#fragment_id

  1. scheme:传输协议, 我们经常看到的传输协议有三种,分别是http,https,ftp
  2. domain:域名或ip
  3. port:服务器端口
  4. path:服务器路径
  5. query_string:查询参数,以’?’为起点,每个参数通过&分隔开,再以=分割参数key-value,
  6. freagment_id:锚参数不是服务器资源的一部分,理论上不会发送给服务器。

http://www.baidu.com/index.php?username=guol进行解析,结果以元祖返回:
urlparse
urlparse.urlunparse(url)函数将拆分的url元组组合成完整的url。

urlsplit()与urlunsplit()完成与urlparse()、urlunparse()类似的功能。但是解析的元组不包括参数项。

urljoin用于拼接URL,将url中的相对地址结合组成一个绝对URL地址。函数urljoin在通过为URL基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用。
需要注意的是,如果基地址并非以字符’/’结尾的话,那么URL基地址最右边部分就会被这个相对路径所替换。如果希望在该路径中保留末端目录,应确保URL基地址以字符/结尾。

参考
http://my.oschina.net/guol/blog/95699

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值