用Python+requests库批量下载知乎高赞回答中的所有表情包

最新推荐文章于 2024-08-17 09:41:34 发布

拇指笔记

最新推荐文章于 2024-08-17 09:41:34 发布

阅读量627

点赞数

分类专栏： Python爬虫 Python脚本文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_44610644/article/details/105552782

版权

4 篇文章

订阅专栏

4 篇文章

订阅专栏

本文分享了一款使用Python的requests和bs4库编写的爬虫程序，该程序能从知乎高赞回答中抓取表情包。通过解析HTML和使用正则表达式，程序成功抓取了数百张表情包，并提供了完整代码和表情包下载方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

干货分享

今天研究了会requests库。发现和urllib库功能类似，很好上手，因此写了个Demo爬了爬表情包。我选取了几个知乎里关于表情包问题的高赞回答，一共爬取了三个回答共六百多个表情包。

re：正则匹配，用来提取图片信息
bs4：解析HTML文件
urllib ：根据提取到的连接下载图片
requests：发送http请求

爬到的表情包如下：

整个程序实现还是很简单的，就是标准的爬取静态网页的过程。首先是确定需要爬取的信息位置，F12打开看一下，很快确定了图片的所在位置。

<img src="https://pic1.zhimg.com/80/v2-bffbbe33c937ceb498d0882bf21a651c_720w.jpg">

接下来就是使用bs4库解析一下get到的页面信息。四行代码就可以实现这一功能。

最后使用urllib库的urlretrieve方法下载图片即可，同时需要记着为每下载一张图片改一次名。

如果觉得本文还可以，还请各位点个在看。

在这里插入图片描述