python爬取网页汉字_程序小技巧：Python3借助requests类库3行代码爬取网页数据！快来...

最新推荐文章于 2023-08-16 14:15:04 发布

weixin_39526185

最新推荐文章于 2023-08-16 14:15:04 发布

阅读量198

点赞数

文章标签： python爬取网页汉字用python爬取网页数据

爬取网页数据是python很长干的一件事情，不过做起来基本上都是很冗长的一段代码，看起来复杂，不宜理解。今天给大家分享一个小诀窍，利用python3中的requests类库进行爬取网页数据。

我们先看一哈用这个requests类库做的效果

本节分享技术知识点：

python导入三方类库的学习
requests类库的简单使用
爬取网页数据

一、爬取网页数据实现代码

# -*- coding:UTF-8 -*-

import requests

if __name__ == '__main__':

target = 'http://gitbook.cn/'

req = requests.get(url=target)

print(req.text)

这就是实现爬取网页数据的全部代码，简单易操作。python的魅力，就是用最少的代码做最多的事。

二、创建一个python类，把上面的代码复制进去

1、如创建一个叫 pachong的类，如下图(文件取名，随意)

创建好以后，把上面第一步的代码复制进去，这时候会报红。要解决这个报红的问题则需要导入第三方类库。

三、导入第三方类库

1、其实导入三方类库也很简单，有下面两种方式。(此次讲解以mac为列)

3.1.1、输入requests时按alt+回车键(Mac电脑)

3.1.2、或者点击这个红色灯泡，然后install导入第三方类库

如上面两种方式，我们便可以轻松的导入类库了。

四、运行代码

1、导入成功后，点击requests不在报红，则开始点击运行代码

运行完后，就可以爬取到网页数据了，如下图所示。

到这里我们就轻松的实现了网页数据的爬取，我们后面要做的就是使用正则表达式，从上图的数据中，过滤出自己需要的数据。

weixin_39526185

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。