python爬虫学习9

本文介绍Python的urllib.parse模块,用于处理URL。主要内容包括urlparse方法,它能分解URL成scheme、netloc、path、params、query和fragment等部分,并讨论了urlparse的参数设置及其返回值。
摘要由CSDN通过智能技术生成

python爬虫学习9

  • 解析连接

    前面我们知道,urllib中的parse模块定义了处理URL的接口,通过调用该模块我们可以实现,例如URL各部分的抽取、合并以及连接转换。

    下面,让我们一起了解几个parse模块中的常用方法:

    • urlparse方法
      import urllib.parse
      
      # prase.urlparse
      
      url = "https://baike.baidu.com/item/Python/407313?fr=aladdin"
      result = urllib.parse.urlparse(url)
      
      print(type(result))
      print(result)
      

      运行结果:

      在这里插入图片描述

      可以看到结果是一个 urllib.parse.ParseResult 类,共包含六部分:

      • scheme
      • netloc
      • path
      • params
      • query
      • fragment</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值