使用tess4j原因是验证码图片地址由js动点击打开链接态生成,和时间戳有关,导致常规爬虫获取图片地址下载的方法得到的验证码与网页显示的不同,所以想到使用截屏方案截取验证码图片,使用tess4j进行识别,达到自动识别的目的,识别率有点低。
版本java1.8 tess4j 3.4 selenium-java 3.6.0
1.eclipse新建java项目,将下载的tess4j解压后,将dist目录下的jar文件复制到lib目录下,然后将lib目录,src目录,tessdata目录复制到新建的java项目中,将下载的selenium-java中所有jar文件复制到eclipse新建的项目中。
2.将所有jar文件添加到build path中,windows下,将tess4j解压目录下lib目录下win32-x86(32位系统)或win32-x86-64(64位系统)下