python---爬取表情包

最新推荐文章于 2022-02-13 21:37:36 发布

⋘森林⋙

最新推荐文章于 2022-02-13 21:37:36 发布

阅读量589

点赞数

分类专栏：编程语言 python--爬虫

本文链接：https://blog.csdn.net/weixin_43890794/article/details/94996556

版权

这篇博客讲述了如何使用Python爬虫从斗图网站上批量下载表情包。首先分析URL，发现是GET请求，通过右键复制图片链接获取图片URL。使用requests库的urlretrieve函数下载图片，并通过os模块指定保存目录和避免文件名冲突。然后，利用BeautifulSoup解析HTML，找出所有img标签，提取图片URL，遍历并调用下载函数完成批量下载。

摘要由CSDN通过智能技术生成

对斗图网站上表情图片进行爬取
首先打开要爬取的表情包网站对网站的URL进行分析
在这里插入图片描述
这是一个get请求问号后面的page是参数因此这是第一页的内容

我先对单个图片进行下载操作
首页获取图片的url 鼠标放在要下载的图片上右键---------》点击复制图片连接
将图片链接给一个变量 url来接收然后用request库下的urlretrieve函数(要传两个参数第一个是要解析的url ，第二个是给下载的文件取一个文件名 )进行解析下载。这时后点击RUN 这张图片就在当前目录下载好了

from urllib import request
import requests
url = "http://ww3.sinaimg.cn/bmiddle/9150e4e5gy1g4qhetovzsg206j06j3yv.gif"
request.urlretrieve(url,‘index.png’)

我想让这张图片下载的时候可以指定目录而且我要一次下载多个文件时名字也不能重复
首先指定目录就要使用os模块给图片分配不同的名字我使用图片URL后面自带的名字这需要将Url的字符串进行分割
我首先将url的字符进行分割处理
使用split函数以 / 进行字符串的分割分割以后使用pop函数将数组中最后一位取出来如下:

>>> url = "http://ww3.sinaimg.cn/bmiddle/9150e4e5gy1g4qhetovzsg206j06j3yv.gif"
>>> split_list = url.split('/')
>>> print(split_list)
['

最低0.47元/天解锁文章

⋘森林⋙

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python---爬取表情包

周末没什么事在网上找视频课找到了一个还不错的爬虫视频课突然对爬虫有了兴趣就跟这视频操作了一下所以写文章记录一下方便以后查看复习首先打开要爬取的表情包网站对网站的URL进行分析这是一个get请求问号后面的page是参数因此这是第一页的内容我先对单个图片进行下载操作首页获取图片的url 鼠标放在要下载的图片上右键---------》点击复制图片连接...
复制链接

扫一扫

专栏目录