爬取Google网站的图片

爬取Google搜索引擎图片的工具,工具链接如下:

https://github.com/hardikvasa/google-images-download

该工具的好处是可以指定下载图片分辨率以及下载图片的张数

    1.使用:

        (a)clone 项目到本地

        (b)进行相关配置:

           (1)pip install google_images_download

           (2)cd google_images_download

             (3)   sudo python setup.py install

        (c) cd google-images-download 

        (d) python google_images_download.py -k makeup -l 500 -s '>4MP'

       附录:

       笔者使用的是-k,-l,-s这三个参数传入.py文件,也可以选择其它参数。

       参数查询文档如下:

       https://google-images-download.readthedocs.io/en/latest/arguments.html

   2.可能遇到的问题:

       (a)参数设置问题:

            1.错误:-l 500  (下载期望是500张,大于默认100),错误如下图

           2.解决办法:

               (a)下载chrome browser 对应的chromedriver ,下载链接如下:

                   http://chromedriver.storage.googleapis.com/index.html 

                   下载对应的chromedriver,笔者的chrome browser 版本是78.0.3904.108(正式版本) (64 位),下载的          chromedriver  版本是78.0.3904.105 ,对应的chromedriver  版本截图如下,由于本地是mac电脑,所以选择箭头所指的文件:

              (b)将chromedriver _mac64.zip下载到本地之后解压,解压后截图如下:

              (c)将解压后的chromedriver,copy到/usr/local/bin/目录下

              (d) 运行python google_images_download.py -k makeup -l 500 -s '>4MP' -cd /usr/local/bin/chromedriver  

 

 

 

 

 

 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值