Python之urllib.parse模块
简介:此模块用来处理url的一个模块里面有很多方法,一般用于爬虫中,暂时介绍几种,不定时更新
-
urlparse(url, scheme=’’, allow_fragments=True)(最常用的方法)
- 作用:可以用来确定网络协议(HTTP、FTP等等 )、服务器地址、文件路径,等。
- 返回值:是一个元组。每个组件是一串字符,也有可能是空的。组件不能被解析为更小的部分,%后面的也不会被解析,分割符号并不是解析结果的一部分,除非用斜线转义。
from urllib.parse import urlparse
the_url = urlparse('https://blog.csdn.net/weixin_45099622')
print(the_url