分享一段百度爬虫代码

最新推荐文章于 2023-11-09 15:05:52 发布

起一点

最新推荐文章于 2023-11-09 15:05:52 发布

阅读量223

点赞数

文章标签：爬虫 java docker python c++ c语言 sublime text

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46352164/article/details/132686564

版权

import requests
import re
import os
import time

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'}
name = '切割机'
num = 0
x =10 #input('您要爬取几张呢?，输入1等于60张图片。')
for i in range(int(x)):
    name_1 =r'D:\object\PycharmProjects\aiproess\speader\bauduword\imgs'#图片保存地址
    url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word='+name+'&pn='+str(i*30)
    res = requests.get(url,headers=headers)
    htlm_1 = res.content.decode()
    a = re.findall('"objURL":"(.*?)",',htlm_1)
    if not os.path.exists(name_1):
        os.makedirs(name_1)
    for b in a:
        num = num +1
        try:
            img = requests.get(b)
        except Exception as e:
            print('第'+str(num)+'张图片无法下载------------')
            print(str(e))
            continue
        f = open(name_1+'/'+name+str(num)+'.jpg','ab')
        print('---------正在下载第'+str(num)+'张图片----------')
        f.write(img.content)
        f.close()
print('下载完成')

电脑系统是windows10

<切割机>就是我们要爬取的关键字,图片保存<D:\object\PycharmProjects\aiproess\speader\bauduword\imgs>地址注意按自己需要更改

注意别爬取太多，会被封的！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享一段百度爬虫代码

切割机>就是我们要爬取的关键字,图片保存<D:\object\PycharmProjects\aiproess\speader\bauduword\imgs>地址注意按自己需要更改。电脑系统是windows10。注意别爬取太多，会被封的！
复制链接

扫一扫

起一点 CSDN认证博客专家 CSDN认证企业博客

码龄4年

34: 原创

10万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

507: 积分

114: 粉丝

157: 获赞

17: 评论

163: 收藏

私信

关注

热门文章

分类专栏

最新评论

用python的turtle画一个红色五角星
起一点: 没错，大道至简
模拟网络推图—获得带网址的图片
普通网友: 写的很好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
用python的turtle画一个红色五角星
ssgggg_: 哈哈，所以说，有的时候是想太多，
标注标签删除和转移
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
十四届德旺杯报名两道题解答
CSDN-Ada助手: 恭喜您写完了第20篇博客！标题“十四届德旺杯报名两道题解答”让我很感兴趣。您的博客内容一直都非常精彩，我一直都很期待您的新文章。在这篇博客中，您提供了有关德旺杯报名的两道题目的解答，这对于那些对此感兴趣的人来说无疑是非常有帮助的。我要赞扬您的写作风格，非常清晰和易懂。您总能将复杂的问题解释得简单明了，这对于像我这样的读者来说是非常有帮助的。我真的很期待您未来的创作。我希望您能继续保持这样的创作势头，并继续分享您的知识和经验。对于下一步的创作建议，我建议您可以考虑写一些关于如何应对挑战和解决问题的文章。您的解答总是非常深入和准确，我相信您一定有很多有关如何面对困难和克服障碍的宝贵经验可以分享。再次感谢您的努力和奉献，期待您未来更多的精彩文章！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。