用个小爬虫正则来爬取百度照片（以前六张为例）

最新推荐文章于 2024-05-03 11:12:36 发布

Zjh0928

最新推荐文章于 2024-05-03 11:12:36 发布

阅读量272

点赞数

文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zjh0928/article/details/130712409

版权

import os
import re
import urllib.request
***导包
url = 'https://image.baidu.com/'
***请求头
headers = {
    "User-Agent": "Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/101.0.0.0Safari/537.36",
    "Accept-Language": "zh-CN,zh;q=0.9",
}

request = urllib.request.Request(url=url, headers=headers)
response = urllib.request.urlopen(request)
html = response.read().decode('utf-8')
# print(html)
pattern = 'background-image: url\((.*?)\)'
img_list = re.compile(pattern, re.S).findall(html)
# print(img_list)
name_pattern = ' <div class="bd-home-content-album-item-title             "> (.*?)  </div>'
name2_pattern = '<div class="bd-home-content-album-item-title              bd-home-content-album-item-title-linkmore"> (.*?)  <span class="bd-home-content-album-item-title-arrow">></span>  </div>'
name_list = re.compile(name_pattern, re.S).findall(html)
name2_pattern = re.compile(name2_pattern, re.S).findall(html)[0]
name_list.append(name2_pattern)
****建立一个文件保存图片
if not os.path.exists('./百度图片'):
    os.mkdir('./百度图片')

for i in range(len(img_list)):
    name = re.sub('[\\\/|:*?"<>]', '-', name_list[i])
    urllib.request.urlretrieve(url=img_list[i], filename='./百度图片/' + name + '.png')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
用个小爬虫正则来爬取百度照片（以前六张为例）

正则，爬虫，百度图片
复制链接

扫一扫

Zjh0928 CSDN认证博客专家 CSDN认证企业博客

码龄2年

10: 原创

135万+: 周排名

20万+: 总排名

2889: 访问

: 等级

136: 积分

9: 粉丝

11: 获赞

3: 评论

11: 收藏

私信

关注

热门文章

最新评论

python获得视频弹幕，我爱腾讯视频
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
用个小爬虫正则来爬取百度照片（以前六张为例）
CSDN-Ada助手: 恭喜您写出了这篇非常实用的博客，能够用小爬虫正则来爬取百度照片，这对于许多人来说都是一个非常实用的技能。希望您能够继续保持创作的热情，分享更多有趣的技巧和经验。如果可能的话，可以考虑分享一些更高级的技能或者更实用的小工具，让读者受益更深。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
爬取点网站图片
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
找出字符串中第一个匹配项的下标
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(3)增加除了各种控件外，文章正文的字数。
石子合并问题
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。