java selenium tess4j 截部分图识别验证码

最新推荐文章于 2024-03-19 10:19:59 发布

枫子--

最新推荐文章于 2024-03-19 10:19:59 发布

阅读量403

点赞数

分类专栏： selenium 文章标签： java selenium tess4j

本文链接：https://blog.csdn.net/qq_24545217/article/details/103947019

版权

selenium 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

自己的代码记录一下

导入

<dependency>
       <groupId>net.sourceforge.tess4j</groupId>
       <artifactId>tess4j</artifactId>
       <version>4.4.1</version>
       </dependency>

解压tess4j 包取出 tessdata 文件夹放到src/test/resources下面。

private static String doOCR() throws Exception {
WebElement element = driver.findElement(By.xpath("//div[@class='validCode']"));

       //获取整页屏幕截图
       File screenshot = ((TakesScreenshot)driver).getScreenshotAs(OutputType.FILE);
       BufferedImage fullImg = ImageIO.read(screenshot);

       //获取元素在页面上的位置
       Point point = element.getLocation();
       //获取元素的宽度和高度
       int eleWidth = element.getSize().getWidth();
       int eleHeight = element.getSize().getHeight();

       //裁剪整个页面截图以仅获取元素截图
       BufferedImage eleScreenshot= fullImg.getSubimage(point.getX(), point.getY(),
               eleWidth, eleHeight);
       ImageIO.write(eleScreenshot, "png", screenshot);

       //将元素截图复制到磁盘
       long imageName = ToolUtil.getNowUTC();
       File screenshotLocation = new File("C:\\Screen",imageName+".png");
       FileUtils.copyFile(screenshot, screenshotLocation);

       //识别验证码
       ITesseract instance = new Tesseract();//调用Tesseract
       String tesspath = System.getProperty("user.dir");
       instance.setDatapath(tesspath + "/src/test/resources/tessdata");//进行读取，默认是英文，如果要使用中文包，加上instance.setLanguage("chi_sim");
       String code = instance.doOCR(screenshotLocation);
       return code;
   }

枫子--

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java selenium tess4j 截部分图识别验证码

自己的代码记录一下导入<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>4.4.1</vers...
复制链接

扫一扫