爬虫:自动识别简单图形验证码 爬取接口不再人工输入验证码!!!!

本文介绍了如何使用名为GraphicCR的Java库来自动识别简单的图形验证码,以解决爬虫登录时的人工输入问题。该库成功率高,仅在特定数字混淆时可能出错。文章提供了下载链接、引入jar包的方法以及使用示例代码,适用于需要自动处理验证码的Java项目。
摘要由CSDN通过智能技术生成


前言

最近公司业务中接到一个需求,需要持续 不断的爬取某个网站,且网站必须要登录(我们这边有账号密码),实现这个需求的难题在于登录此网站的时候必须输入验证码,验证码不可能用到人工输入,目前市场上验证码识别技术在阿里和腾讯比较成熟的,不过都是收费的,下面我介绍一款,非常简单并且非常强大的第三方插件库。


一、GraphicCR - 基于 Java 的简单图形验证码识别

参考几个网站的验证码: 青岛农业大学教学一体化服务平台-- http://jwglxt.qau.edu.cn/ 蚌埠医学院教务网络管理系统 -- http://211.70.128.23/JWWEB/home.aspx

类似与以上两种平台的二维码,亲测,成功率在95%以上 只有在 3 和 8、o和0
的时候可能会出现问题,其余基本不会有问题。

下载链接
链接:https://pan.baidu.com/s/1jhIo9C4a1uTNBkRXtNV5zw
提取码:tiy0
下载成功之后打开out文件夹 复制graphiccr-1.0.7.jar到项目中
eclipse直接复制进去 然后 build path
idea 新建一个文件夹 专门放jar包的 然后添加到项目中
(只复制到项目目录下不行,必须添加到jar包目录下,详情百度)

二、使用步骤

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值