python网络请求的库_网络请求urllib库的基本使用 ----------python的爬虫学习

最新推荐文章于 2021-02-03 08:21:53 发布

weixin_39986466

最新推荐文章于 2021-02-03 08:21:53 发布

阅读量55

点赞数

文章标签： python网络请求的库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39986466/article/details/112965610

版权

简单的网络请求：

from urllib import request

url = "http://www.baidu.com"

rep=request.urlopen(url)

urlopen请求数据，返回给了变量rep

对返回数据的操作：

urlopen()返回的结果是类文件对象，也是可迭代的，下面列举出比较常用的方法

read()、readline()、readlines() ：读取文件

rep = request.urlopen(url)

rep.read()

【Squeezed text】

rep.readline()

b'\n'

rep.readlines()

【Squeezed text】

info()：返回头信息

print(rep.info())

Date: Sat, 27 Jul 2019 03:32:18 GMT

Content-Type: text/html

Transfer-Encoding: chunked

Connection: Close

Vary: Accept-Encoding

Set-Cookie: BAIDUID=71F5315626EBFC522CD27C212E0BDC71:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com

Set-Cookie: BIDUPSID=71F5315626EBFC522CD27C212E0BDC71; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com

#太多了省略.......

getcode()：返回http状态码

print(rep.getcode())

200

geturl()：返回url

print(rep.geturl())

http://www.baidu.com

urllib中内置了一个方法使保存网页数据更加方便

from urllib.request import urlretrieve

url = "http://www.baidu.com"

urlretrieve(url,r'D:/baidu.html')

上面代码等同于

from urllib import request

request.urlretrieve("http://www.baidu.com",r"D:/baidu.html")

('D:/baidu.html', )

urlretrieve(url, filename=None, reporthook=None, data=None)

url: 文件url

filename: 保存到本地时,使用的文件(路径)名称

reporthook: 文件传输时的回调函数,常用于显示进度条

data: post提交到服务器的数据

该方法返回一个二元元组("本地文件路径",)

weixin_39986466

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。