urllib库使用(1)

最新推荐文章于 2024-07-06 01:58:07 发布

丙丁火

最新推荐文章于 2024-07-06 01:58:07 发布

阅读量99

点赞数

分类专栏：爬虫文章标签： python爬虫 urllib

本文链接：https://blog.csdn.net/caicaibird0531/article/details/90608289

版权

爬虫专栏收录该内容

11 篇文章 0 订阅

订阅专栏

urlopen函数

urlopen(urlstr, postQueryData=None)
urlopen()将会返回一个文件类型对象，就像在目标路径下打开了一个可读文件。如文件对象是f，那么“句柄”会支持一些读取内容的方法，如f.read()，f.readline()，f.readlines()，f.close()和getcode()等。

from urllib import request

url = 'https://www.baidu.com/'
resp = request.urlopen(url)print(resp.read())

urlretrive函数

这个函数可以方便的将网页上的一个文件保存到本地。保存图片的示例代码如下。

from urllib import request

img_url = 'http://img.php.cn/upload/article/...'
request.urlretrieve(img_url,"img.jpg")

urlencode函数

urlencode可以把字典数据转换为URL编码的数据。

from urllib import parse

aDict = {'name':'爬虫','time':'17:37'}
resp = parse.urlencode(aDict)
print(resp)
#name=%E7%88%AC%E8%99%AB&time=17%3A37

parse_qs函数

可以将经过编码后的url参数进行解码。

from urllib import parse

a_str = 'name=%E7%88%AC%E8%99%AB&time=17%3A37'
result = parse.parse_qs(a_str)
print(result)

urlparse函数

对url中的各个组成部分进行分割。

url = 'https://www.baidu.com/s?wd=%E7%88%AC%E8%99%AB&rsv'
result = parse.urlparse(url)
print(result)
print(result.scheme)

#ParseResult(scheme='https', netloc='www.baidu.com', path='/s', params='', query='wd=%E7%88%AC%E8%99%AB&rsv', fragment='')
#https

丙丁火

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
urllib库使用(1)

urlopen函数urlopen(urlstr, postQueryData=None)urlopen()将会返回一个文件类型对象，就像在目标路径下打开了一个可读文件。如文件对象是f，那么“句柄”会支持一些读取内容的方法，如f.read()，f.readline()，f.readlines()，f.close()和getcode()等。from urllib import request...
复制链接

扫一扫

专栏目录