小菜鸟Python历险记:(第六集)

今天写的文章是记录我从零开始学习Python的全过程。

在python中可以在方法中定义全局变量,是通过一个关键字global来实现的。

在python中的globals()方法可以返回一个包含全局范围内所有变量的字典,其中键是变量名,值为变量值。当然在python中还有其他方法也能实现相似功能。locals()方法:返回的是该作用域内所有变量的字典,说人话就是如果这个方法用在方法中就返回这个方法内所有变量的字典。如果用在全局中,返回的就是全局变量的字典。也就是locals方法包含上面globals方法,当然这个比喻不正确但是理解的时候可以这样去理解。

在python中其实有一个库用得非常多,就是urllib模块。其中urllib.request模块是用于操作url的库,其中的urlopen()方法可以用来访问浏览器,也就是实现在网页上爬取数据的功能。

urllib中包含多个模块:

  1. urllib.request模块用来打开和读取url

  1. urllib.error模块抛出异常

  1. urllib.parse模块用来解析url

  1. urllib.robotparser模块用来解析robots.txt文件

如下图所示:

其中urlopen()方法比较重要,方法中需要传的参数有url是一个字符串或是一个Request对象,而data必须是一个对象,用于给出要发送到服务器的附加数据。

下面通过学习例子一起学习一下如何使用这个方法在网页上下载数据,如下图所示:

首先通过import将urllib.request模块导入到工程中,然后用urlopen()方法把url打开。但是这个时候读取的数据其实都是乱码的,因为没有进行转码操作。

所以下面使用data=html.read().decode('utf-8')将网页中的数据读出来以后进行转码转成utf-8格式,再把读出来的数据打印出来进行查看。

以上就是一个爬取网页数据的学习小例子。

今天学习分享就介绍到这,下篇学习分享再见。

坚持学习注定会有收获。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喵桑さん

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值