python爬虫的开始——用urllib发送请求

记录一下我的学习路程,在python中用urllib发送请求是非常简单的,直接附上图片

 

urllib.request.urlopen(url)是向网页发送一个GET式的请求,response储存网页返回的信息

response.read()表示将返回的信息以HTML的形式显示,decode("utf-8”)表示将按ASCII标准编码的中文按“utf-8"的格式解码

例如:成都

如果不写decode(”utf-8")显示的是:成&#x90FD,这其实就是成都的ASCII标准编码

贴一个在线解码的链接:点这里

下面是凑字数的,

俄罗斯联邦(Российская Федерация),亦称俄罗斯(Россия),是由22个自治共和国、46个、9个边疆区、4个自治区、1个自治州、3个联邦直辖市组成的联邦半总统制共和国。位于亚欧大陆北部,地跨亚欧大陆两大洲,国土面积1709.82万平方公里,是世界上面积最大的国家,也是一个由194个民族构成的统一多民族国家,主体民族为俄罗斯人,约占全国总人口的77.7%。 [1] 

俄罗斯人的祖先为东斯拉夫人罗斯部族。公元15世纪末,以莫斯科大公国为中心,逐渐形成统一的封建国家。 [1]  1547年伊凡四世大公称号为沙皇,1721年彼得一世元老院授予“全俄罗斯皇帝”的头衔,并建立俄罗斯帝国。对外走上了侵略扩张的道路,曾吞并欧亚多个国家,于18世纪中后期叶卡捷琳娜二世·阿列克谢耶芙娜统治时达到鼎盛时期。1917年十月革命后建立了苏维埃俄国。1922年12月30日,苏俄同一战后从俄罗斯帝国独立出去的各个国家组成苏联。 [1]  冷战期间成为超级大国,通过大力发展军事力量来同美国争霸。 [2] 

苏联解体后,最大加盟国俄罗斯继承苏联大部分军事力量。拥有世上最大的核武器库。俄罗斯是五大联合国安全理事会常任理事国之一,对安理会议案拥有一票否决权。此外,它还是上海合作组织成员国、金砖国家之一。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python爬虫教程urllib主要是介绍了Python爬虫技术中的urllib库的基础用法。该教程详细讲解了urllib库的各种功能和方法,包括发送请求、处理响应、设置请求头、处理异常等。这个教程对于想要学习和使用Python进行网络爬虫的人来说具有很大的参考价值。 同时,该教程也提到了一些常见的问题和解决方法,例如模拟超时的处理方法。在网络爬虫中,有时候我们长时间无法访问一个页面,可能是因为网速有限或者被发现我们是一个爬虫。针对这种情况,可以使用timeout参数来设置超时时间,如果超过了设定的时间仍无法获取响应,则会抛出URLError异常,我们可以在异常处理中对超时进行相应的处理。 总的来说,Python爬虫教程urllib是一个很好的学习资源,适合想要入门或深入学习Python爬虫技术的人使用。它提供了详细的教程和实例,可以让你快速上手和掌握使用urllib库进行网络爬虫的基本知识和技巧。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Python爬虫urllib基础用法教程](https://download.csdn.net/download/weixin_38656741/12858843)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Python爬虫 —— urllib库的使用(get/post请求+模拟超时/浏览器)](https://blog.csdn.net/qq_50587771/article/details/123840479)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [python爬虫urllib3的使用示例](https://download.csdn.net/download/weixin_38681147/12867742)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值