python爬虫的开始——用urllib发送请求

本文介绍了如何在Python中使用urllib库发送GET请求,并解析响应内容。通过urllib.request.urlopen(url)获取网页信息,利用response.read().decode("utf-8")解码HTML内容,以理解网页上的中文数据。
摘要由CSDN通过智能技术生成

记录一下我的学习路程,在python中用urllib发送请求是非常简单的,直接附上图片

 

urllib.request.urlopen(url)是向网页发送一个GET式的请求,response储存网页返回的信息

response.read()表示将返回的信息以HTML的形式显示,decode("utf-8”)表示将按ASCII标准编码的中文按“utf-8"的格式解码

例如:成都

如果不写decode(”utf-8")显示的是:成&#x90FD,这其实就是成都的ASCII标准编码

贴一个在线解码的链接:点这里

下面是凑字数的,

俄罗斯联邦(Российская Федерация),亦称俄罗斯(Россия),是由22个自治共和国、46个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值