关于使用opencv进行文本识别并进行字母数字的框定

作为小白的我学会了使用opencv进行文本的识别和框定,很开心!

from PIL import Image
import pytesseract
import cv2 as cv


##inputting and show initial image
img = cv.imread("D:\LAB\Tesseract\mur.png")
cv.namedWindow("Image")
cv.imshow("Image", img)
cv.waitKey(0)
cv.destroyAllWindows()

text = pytesseract.image_to_string(Image.open(r'D:\LAB\Tesseract\mur.png'))#path of image
print(text)
print (pytesseract.image_to_boxes(img))#information about Xpoint Ypoint width height

##Detecting Characters
hImg,wImg,_ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
      print(b)
      b=b.split(' ')
      print(b)
      x,y,w,h = int(b[1]),int(b[2]),int(b[3]),int(b[4])
      cv.rectangle(img,(x,hImg-y),(w,hImg-h),(0,0,255),3)
      cv.putText(img,b[0],(x,hImg-y+30),cv.FONT_HERSHEY_COMPLEX,1,(50,50,255),1)

##output image
cv.imshow("Image", img)
cv.waitKey(0)

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用Python和OpenCV库来进行图像识别数字的任务。下面是一个简单的示例代码,可以帮助你开始: ```python import cv2 import pytesseract def recognize_digits(image_path): # 读取图像 image = cv2.imread(image_path) # 将图像转换为灰度图 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 对图像进行二值化处理 _, threshold = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 寻找图像中的轮廓 contours, _ = cv2.findContours(threshold, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) digits = [] # 遍历每个轮廓区域 for contour in contours: # 计算轮廓的边界框 x, y, w, h = cv2.boundingRect(contour) # 过滤掉过小或过大的轮廓区域 if w >= 10 and h >= 20 and cv2.contourArea(contour) >= 100: # 提取轮廓区域并进行数字识别 digit_roi = threshold[y:y+h, x:x+w] text = pytesseract.image_to_string(digit_roi, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789') digits.append(text) # 在图像上绘制边界框和识别结果 cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2) cv2.putText(image, text, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2) # 显示图像及识别结果 cv2.imshow("Result", image) cv2.waitKey(0) cv2.destroyAllWindows() return digits # 调用函数进行图像数字识别 image_path = 'path/to/your/image.jpg' recognized_digits = recognize_digits(image_path) print(recognized_digits) ``` 这段代码使用OpenCV库读取图像,将其转换为灰度图并进行二值化处理。然后,它会寻找图像中的轮廓,并过滤掉过小或过大的轮廓区域。对于符合条件的轮廓区域,它会提取区域并使用Tesseract库进行数字识别。最后,它会在图像上绘制边界框和识别结果,并显示出来。 你需要安装OpenCV和pytesseract库,并且需要下载并安装Tesseract OCR引擎,用于数字识别。你可以从以下链接获取更多关于Tesseract的信息:https://github.com/tesseract-ocr/tesseract 当然,这只是一个简单的示例代码,你可能需要根据自己的具体需求进行进一步的调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值