bing图片爬取

最新推荐文章于 2024-05-23 10:56:21 发布

逢人之

最新推荐文章于 2024-05-23 10:56:21 发布

阅读量350

点赞数 5

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63482232/article/details/131322914

版权

import urllib
import requests
import re
from bs4 import BeautifulSoup
import time
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/6.1.2107.204 Safari/537.36'
}
path = './测试/' # 保存的路径
query = '中华田园猫图片' # 搜索的图片

rule = re.compile(r"\"murl\"\:\"http\S[^\"]+")
for i in range(1, 101, 35): # 更改first，爬取不同的图片
        urls = f'https://cn.bing.com/images/async?q={query}=&first={i}&count=35&mmasync=1'
        html = requests.get(url=urls, headers=header).text
        soup = BeautifulSoup(html, "lxml")
        link_list = soup.find_all("a", class_="iusc")
        for id, link in enumerate(link_list):
        result = re.search(rule, str(link))
        url = result.group(0)[8:]
        try:
                time.sleep(0.5)
                urllib.request.urlretrieve(url, path + str(id + i) + '.jpg')
        except Exception as e:
                time.sleep(1)
                print("获取异常，跳过...")
        else:
                print(f"成功保存{str(id + i)}: {url}")

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
bing图片爬取

bing图片爬取
复制链接

扫一扫

逢人之 CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

179万+: 周排名

16万+: 总排名

2269: 访问

: 等级

75: 积分

16: 粉丝

24: 获赞

6: 评论

44: 收藏

私信

关注

热门文章

分类专栏

爬虫 1篇

最新评论

npm报错 - 4080
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
npm报错 - 4080
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
npm报错 - 4080
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
npm报错 - 4080
CSDN-Ada助手: Vue入门技能树或许可以帮到你：https://edu.csdn.net/skill/vue?utm_source=AI_act_vue
亲亲漫画网页版批量下载（含js逆向）
CSDN-Ada助手: 非常棒的博客！你的标题和摘要内容非常吸引人，让我对你的技术实力和创作动力充满了期待。继续保持创作的热情吧！除了你在标题和摘要中提到的练习js逆向，爬虫和scrapy，批量下载漫画之外，还有一些与该博文相关的扩展知识和技能可以进一步学习。比如，你可以尝试了解更多关于AES加密算法的原理和应用场景，这将有助于你更好地理解和应用逆向工程中的加密解密过程。同时，了解更多关于网络爬虫的相关技术和工具也将对你的博文有所帮助。比如，你可以学习如何使用代理IP以及反爬虫策略，这将提高你爬取数据的成功率。另外，你可以尝试探索其他语言和框架，如Python的BeautifulSoup和Selenium，来扩展你的爬虫技能。这些工具可以帮助你更灵活地处理网页内容和模拟用户行为，使你的爬虫更智能且更高效。希望以上建议对你有所帮助。再次鼓励你持续创作，期待看到更多精彩的博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。