彼岸图网免费图片爬取

彼岸图网免费图片爬取

源码地址

https://gitee.com/Gmnesia/BATWFreeImageCrawl.git

介绍

爬取彼岸图网的图片简介的图片

软件架构

开发语言:java
爬虫框架:WebCollector
工具类:httpclient
第三方平台:太阳http

安装教程
  1. 克隆下代码以后找到BATWFreeImageCrawl文件
  2. 修改第155行的文件保存位置
  3. 修改第207行从太阳http获取的ip列表(ip间隔使用英文逗号“,”进行分割)
  4. 运行main方法即可
运行结果

下载下来的照片这里是导入到minio中了,本地没有在保存
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

使用说明

主要用来做学习使用,如有问题联系1211441748@qq.com邮箱

注意事项
一、ip失效问题
  1. 内容中用到第三方的太阳http获取ip做代理,彼岸图网的防爬取限制挺多,一个ip多次访问后好久都不能恢复,使用时尽量先看下太阳http,先获取到ip,避免自己的ip被封
  2. 太阳http获取到的ip存活时间5分钟,半个小时不等,因此在爬取的过程中执行太长时间会出现ip失效,一开始初始化过多同样也会因为执行时间过长导致ip失效
  3. 如果一下整站爬取不下来,可以考虑分类爬取,或者每个分类的多少页多少页分段爬取
二、图片清晰度
  1. 爬取的是彼岸图网的免费图片,不是4k,因此像素一般,仅做爬虫项目学习使用,
  2. 如想获取4k图片,可看下彼岸图网的会员等,获取到用户信息放到请求中进行爬取
  3. 但是一个年会员账号每天只能下载200张,2022年4月左右,爬取下来的简介图大概在17000张左右,用一个会员每天执行可能要三个月。。。。。。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白依山

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值