11.2.1 用 requests.get()函数下载一个网页

requests.get()函数接受一个要下载的 URL 字符串。通过在 requests.get()的返回
值上调用 type(),你可以看到它返回一个 Response 对象,其中包含了 Web 服务器对你的请求做出的响应。稍后我将更详细地解释 Response 
对象,但现在请在交互式环境中输入以下代码,并保持计算机与因特网的连接:
>>>  import  requests
➊  >>>  res  =  requests.get('http://www.gutenberg.org/cache/epub/1112/pg1112.txt')
>>>  type(res)
<class  'requests.models.Response'>
➋  >>>  res.status_code  ==  requests.codes.ok
True
>>>  len(res.text)
178981
>>>  print(res.text[:250])
The  Project  Gutenberg  EBook  of  Romeo  and  Juliet,  by  William  Shakespeare

This  eBook  is  for  the  use  of  anyone  anywhere  at  no  cost  and  with almost  no  
restrictions  whatsoever.  You  may  copy  it,  give  it  away  or re-use  it  under  the  terms  
of  the  Proje
该 URL  指向一个文本页面,其中包含整部罗密欧与朱丽叶,它是由古登堡计划➊提供的。通过检查 Response 对象的 status_code 
属性,你可以了解对这个网页的请求是否成功。如果该值等于 requests.codes.ok,那么一切都好➋(顺便说一下,HTTP协议中“OK”的状态码是 
200。你可能已经熟悉 404 状态码,它表示“没找到”)。
如果请求成功,下载的页面就作为一个字符串,保存在 Response 对象的 text变量中。这个变量保存了包含整部戏剧的一个大字符串,调用 len(res.text)表明,它的长度超过 178000 
个字符。最后,调用 print(res.text[:250])显示前 250 个字符。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大飞哥软件自习室

希望支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值