java selenium tess4j识别验证码模拟登陆。

本文介绍了如何利用Java结合Selenium和Tess4j库来解决动态生成的验证码识别问题。由于验证码图片由JavaScript动态生成,常规方法无法获取正确图片,故采用屏幕截图方式获取验证码,通过Tess4j进行识别。虽然识别率较低,但提供了完整的环境配置和关键代码示例,包括火狐、IE和Chrome浏览器驱动的下载及设置。
摘要由CSDN通过智能技术生成

使用tess4j原因是验证码图片地址由js动点击打开链接态生成,和时间戳有关,导致常规爬虫获取图片地址下载的方法得到的验证码与网页显示的不同,所以想到使用截屏方案截取验证码图片,使用tess4j进行识别,达到自动识别的目的,识别率有点低。

版本java1.8    tess4j 3.4   selenium-java 3.6.0

1.eclipse新建java项目,将下载的tess4j解压后,将dist目录下的jar文件复制到lib目录下,然后将lib目录,src目录,tessdata目录复制到新建的java项目中,将下载的selenium-java中所有jar文件复制到eclipse新建的项目中。

2.将所有jar文件添加到build path中,windows下,将tess4j解压目录下lib目录下win32-x86(32位系统)或win32-x86-64(64位系统)下

文件为压缩包,包括多个java识别图片文字的项目,国内网站上资料比较少,项目都整理出了测试类及说明,都包含着源代码及jar包、安装包、训练库。希望用得到的人少走弯路,资源都精心整理测试过,高分是必须的。 javaocr项目 纯java程序,国内网站几乎没有见到相关资料。 此项目提供了图形界面的测试类: net.sourceforge.javaocr.main.java javaocr2项目 与以上javaorc属同一项目的不同分支,纯java实现,以下3个测试类请参考。 个人对此项目感觉不错,虽然存在些问题,但是只要训练库好,英文和数字识别率很高。 我用此项目把某网站的数字验证码都截了图做成了训练库,识别率95%以上,用browserTest简单实现了程序自动登录与各种操作功能。 测试类: TestDemo.java MyDemo.java MyDemo2.java Longan-master项目 此项目也是纯java实现,识别英文和数字效果还不错,国内网站几乎没有任何相关资料。 测试类: com.zarkonnen.longan.Main 使用开发工具,请设置程序输入参数为:-o c:/111.txt c:/entest.png 代表输出文件和识别图片 Java_imagetotext项目 安装tesseract-ocr-setup-3.02.02.exe文件,通过java调用tesseract.exe文件识别图片,输出识别结果 测试类: com.chillyfacts.com.my_main.java 根据实际情况修改输入图片、输出文件名、tesseract.exe文件所在路径 Tess4J-3.4.7项目 知名度最大的java识别程序了。 我的环境是windows7 64位 jdk1.8 64位 各种折腾,痛苦的尝试了各版本,基本都是报模块加载失败,安装上vc_redist.x64_2015.exe后执行成功,但是在xp32位还是没有成功。 测试类: TesseractExample.java 测试英文识别 ChOcr.java 测试中文识别 tesseract3.03项目 测试类: de.vorb.tesseract.example.BasicExample 需要加载libtesseract303.dll 运行后一直报异常,没有搞定,也不打算深究了,遗憾!有人成功了,请分享为谢。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值