![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
前言
在找壁纸的时候
无意间逛到一个网站,发现里面的
图都非常精美,吸引我的眼球
![](https://i-blog.csdnimg.cn/blog_migrate/14faa4de09e3ea6a5360bafca0ef4e10.png)
于是,我决定用python批量采集一下它
![](https://i-blog.csdnimg.cn/blog_migrate/9394b5b77b46b41c98719187d8b2ae77.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
环境使用:
Python 3.8 解释器
Pycharm 编辑器
![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
模块
import re
import requests >>> pip install requests
![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
如果安装python第三方模块:
win + R 输入 cmd 点击确定, 输入安装命令
pip install 模块名 (pip install requests)
在pycharm中点击
Terminal(终端) 输入安装命令
![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
代码展示
( 完整源码点击此处跳转
+君羊,找管理员小姐姐领取呀~ )
导入模块
# 导入数据请求模块 --> 第三方模块, 需要安装 pip install requests
import requests
# 导入正则模块 --> 内置模块, 不需要安装
import re
多页采集
for page in range(2, 11):
print(f'=================正在采集第{page}页的数据内容=================')
请求图片目录页面url
url = f'http://www.****.com/dongman/index_{page}.htm'
伪装模拟成浏览器
headers = {
# User-Agent 用户代理 浏览器基本身份信息
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
发送请求
response = requests.get(url=url, headers=headers)
提取图片ID
for img_id in img_id_list:
# img_id变量<袋子> 给 img_id_list 列表<盒子> 里面 元素<苹果> 给装起来
print(img_id)
请求详情页链接
link = f'http://www.*****.com/desk/{img_id}.htm'
发送请求
response_1 = requests.get(url=link, headers=headers)
获取数据内容 网页源代码
img_url, img_title = re.findall('<img src="(.*?)" alt="(.*?)"', response_1.text)[0]
保存数据
img_content = requests.get(url=img_url, headers=headers).content
with open('img\\' + img_title + '.jpg', mode='wb') as f:
f.write(img_content)
print(img_url, img_title)
![](https://i-blog.csdnimg.cn/blog_migrate/6b4c4acbfd5bd8ecc17c29b41ab1d060.gif)
效果展示
![](https://i-blog.csdnimg.cn/blog_migrate/e4b0f7e81d4a9af70a662a0c6b914391.png)
![](https://i-blog.csdnimg.cn/blog_migrate/f88d024cf00a47bcd98d2a18eee6f80f.png)
![](https://i-blog.csdnimg.cn/blog_migrate/459f784f87717fd9432e97234840dbdd.png)
![](https://i-blog.csdnimg.cn/blog_migrate/d3f5bb74752e797ede3bbf19e233c14e.png)
![](https://i-blog.csdnimg.cn/blog_migrate/c12a5d78b95821c7d8f4e9161f41d0b4.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6089f9a1921c6120fadd528d23ea5050.png)
![](https://i-blog.csdnimg.cn/blog_migrate/0eb927793268919e72992bd36c9f99f8.png)
![](https://i-blog.csdnimg.cn/blog_migrate/70d0412e31fc2f31dfda29024ca8e851.png)
![](https://i-blog.csdnimg.cn/blog_migrate/e515a3bcda28fe4cbb680bb9b4fd2c48.png)
![](https://i-blog.csdnimg.cn/blog_migrate/bf879c13a828a8419a6c2c7a6e38781c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/e6eb89240b918829643d2174895e6ea7.png)
![](https://i-blog.csdnimg.cn/blog_migrate/41de146e559bd95af80148ba5c61f7e5.png)
![](https://i-blog.csdnimg.cn/blog_migrate/f33077407624b06e8431dadfc9ca1c6c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/7b214a94ab1c1cc7ce6c503e464616db.png)
![](https://i-blog.csdnimg.cn/blog_migrate/a8d55f31fcace7e5faa47e820b20d803.png)
![](https://i-blog.csdnimg.cn/blog_migrate/efa4252fb7704439ab6434a017609b25.png)
![](https://i-blog.csdnimg.cn/blog_migrate/b1cb70c61b98121929629aac88e7bc22.gif)
尾语
好啦,本文章到这里就结束拉
有喜欢的小伙伴记得给博主一个三连哦~
希望你在学习的路上不忘初心,坚持不懈,学有所成
把时间和精力,放在自己擅长的方向,去坚持与努力,
如果不知道自己擅长什么,就尽快找到它。
![](https://i-blog.csdnimg.cn/blog_migrate/45a4f8bb816d1e8d6aaf3e2b73a01a1d.gif)