python3-按关键字爬取百度图片

最新推荐文章于 2020-03-08 10:03:42 发布

menghaocheng

最新推荐文章于 2020-03-08 10:03:42 发布

阅读量997

点赞数 1

分类专栏： Python 文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/menghaocheng/article/details/79608328

版权

Python 专栏收录该内容

47 篇文章 1 订阅

订阅专栏

别说话！上代码：

import re,os
import requests
from urllib.request import urlretrieve


def download(url,filename,filepath):
    path = os.path.join(filepath,filename)
    try:
        urlretrieve(url,path)
    except:
        print('【错误】当前图片无法下载')


def search(word="美女",localpath="data/", page=None):
    localpath += word
    os.makedirs(localpath , exist_ok=True)
    url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={word}&pn={pn}&gsm={gsm:x}&ct=&ic=0&lm=-1&width=0&height=0'.format(word=word, pn=20 * page, gsm=40 + 20 * page)

    print("HHHC:0====>page=%d,url=\"%s\"" % (page,url))
    try:
        html = requests.get(url).text
    except:
        print("【错误】requests.get 失败")
        return False
    pic_url = re.findall('"objURL":"(.*?)",', html, re.S)
    i = 0;
    for url in pic_url:
        print(url)
        i = i + 1;
        filename = os.path.split(url)[1].split('?')[0]
        if len(filename.split(".")) != 2:
            print("【错误】文件名异常:" + filename)
        download(url, filename, localpath)
    return


def search_20_page(word):
    for i in range(1, 30):
        search(word, "data/", i)


def test_search_list():
    obj_list = ["苹果", "香蕉", "桔子", "橙子", "桃子", "樱桃", "龙眼", "荔枝", "雪梨", "草莓", "葡萄", "猕猴桃", "菠萝", "番石榴", "青梅"]
    for obj in obj_list:
        search_20_page(obj)


if __name__ =='__main__':
    test_search_list()

效果：

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python3-按关键字爬取百度图片

别说话！上代码：import re,osimport requestsfrom urllib.request import urlretrievedef download(url,filename,filepath): path = os.path.join(filepath,filename) try: urlretrieve(url,path) ...
复制链接

扫一扫

专栏目录

menghaocheng CSDN认证博客专家 CSDN认证企业博客

码龄16年

142: 原创

5万+: 周排名

130万+: 总排名

40万+: 访问

: 等级

4456: 积分

77: 粉丝

134: 获赞

87: 评论

520: 收藏

私信

关注

热门文章

分类专栏

最新评论

Tensorflow-@tf_export详解
须弥互联网首席指挥官: @tf_export('app.run') 是一个装饰器（Decorator），用于在 TensorFlow 中标记函数 app.run 的导出名称。在 TensorFlow 中，经常需要在不同的模块或版本之间进行函数的重命名或重构。为了保持代码的向后兼容性，并且便于维护和管理，可以使用 @tf_export 装饰器来明确指定函数的导出名称。具体来说，@tf_export('app.run') 表示将函数 run 导出为 app.run。这意味着在 TensorFlow 的命名空间中，可以通过 app.run 来引用或调用这个函数，而不必关心它的实际定义在哪个模块中。通过使用装饰器标记导出名称，可以更好地组织和管理 TensorFlow 中的函数，并确保代码在不同版本之间的兼容性。
【Android话题-2.1系统服务】谈谈你对zygote的理解
weixin_36204895: zygote处理的不是SystemServer发送的请求，而是处理AMS发送的请求
【c++】std::move(进阶)
Fshinech: ”在等号左边的值就是左值而在等号右边的称为右值“这句话出自哪里呢？左值只能出现在等号左边，右值只能出现在等号右边，但不等于”在等号左边的值就是左值而在等号右边的称为右值“。
vscode配置C++环境（图文详解）
fqg100: 我的插件没有C_Cpp_Runner.makePath 怎么加
Android-查看GPU的使用率
L P F: adb shell cat /sys/class/ 没有后面shell cat /sys/class/kgsl/kgsl-3d0/gpu_busy_percentage这些文件怎么办呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。