go+orc文字识别

本文识别的是tiff 文件中的文字```

package main

import (
	"fmt"
	"github.com/chai2010/tiff"
	"github.com/otiai10/gosseract/v2"
	"gocv.io/x/gocv"
	"image"
	"os"
)

func main() {
	file, err := os.Open("1.tif")
	if err != nil {
		fmt.Println(err)
		return
	}
	defer file.Close()
	img, _ := tiff.Decode(file)
	bounds := img.Bounds()
	width := bounds.Dx()
	height := bounds.Dy()
	// 指定区域的坐标
	box := image.Rect(0, 0, width, height/10*2)
	text := recognizeText("1.tif", box)
	fmt.Println(text)
}

func recognizeText(imagePath string, box image.Rectangle) string {
	// 读取图片
	img := gocv.IMRead(imagePath, gocv.IMReadColor)

	// 裁剪指定区域的图片
	roiImg := img.Region(box)

	// 将裁剪后的图片转换为灰度图像
	grayImg := gocv.NewMat()
	gocv.CvtColor(roiImg, &grayImg, gocv.ColorBGRToGray)

	// 将gocv的Mat格式转换为字节数组
	imgBytes, _ := gocv.IMEncode(".png", grayImg)
	// 识别文字
	client := gosseract.NewClient()
	defer client.Close()
	client.SetLanguage("chi_sim")
	client.SetImageFromBytes(imgBytes.GetBytes())
	text, _ := client.Text()
	// 返回识别到的文字
	return text
}


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
orc(Optical Character Recognition,光学字符识别)是一种常见的图像处理技术,用于将图像中的文字转换成可编辑和可搜索的文本。orc截图文字识别提取是指将截取的屏幕截图中的文字提取出来。 orc截图文字识别提取的过程可以分为以下几个步骤: 1. 图像预处理:首先对截图进行预处理,包括调整图像的亮度、对比度和尺寸等。这可以提高后续的文字识别准确率。 2. 文字定位:通过文本定位算法,识别出截图中的文字区域。这可以帮助我们减少文字识别的范围,提高识别效率。 3. 文字分割:将文字区域进行分割,将每个字符分开。目的是为了将多个字符的识别任务拆分成单个字符的识别任务,提高准确率。 4. 字符识别:对每个字符进行识别,使用OCR算法将字符转换成对应的文本。常见的OCR算法包括基于规则的方法、统计学方法和深度学习方法等。 5. 文本后处理:对于识别结果进行后处理,包括字符校验、错误矫正等。这可以进一步提高文本识别的准确率和可靠性。 orc截图文字识别提取可应用于多种场景,例如将手机截图中的文字转化为可编辑的文本、提取网页截图中的文字或截取屏幕截图中的文字等。它具有重要的实际价值和广阔的应用前景。 需要注意的是,orc截图文字识别提取虽然在近年来取得了巨大的进展,但仍存在一定的限制和挑战。例如,识别率受到图片质量、文字特征、字体大小和字体样式等因素的影响。因此,在实际应用中需要根据具体情况进行算法选择和参数优化,以提高识别效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值