用卷积神经网络（CNN）识别文字

最新推荐文章于 2024-06-21 17:14:50 发布

xgbm_k

最新推荐文章于 2024-06-21 17:14:50 发布

阅读量1.5w

点赞数 1

分类专栏：深度学习文章标签：深度学习卷积神经网络模式识别 keras

本文链接：https://blog.csdn.net/xgbm_k/article/details/82782196

版权

好久没有写博客了，趁最近比较闲来发一篇。
有个项目：

从计算机屏幕上截图
识别截图上的文字

早先识别的方法是：

对比度
颜色
边缘检测

问题是：有些图片会被识别为文字。

前几天闲着就试了一下用卷积神经网络（CNN）来实现这个功能。

生成训练集、测试集和验证集。

首先，拿到一幅带有文字的计算机画面，用工具找到文字区域的起始和终止坐标，再用工具找到图片区域的起始和终止坐标。用下面的代码生成训练集、测试集和验证集（validation dataset，总觉得说验证集怪怪的）。

from random import randint
import numpy as np
from PIL import Image
#这个是我自己写的一个库[PyImageProcess](https://github.com/Kenneth111/PyImageProcess)
from PyImageProcess.utils_yuv import get_a_frame, save_a_patch

def save_patches(com_y, start, end, path, num):
    l1 = len(start)
    l2 = len(end)
    if l1 != l2:
        raise UserWarning("the len of start is not same to that of end!")
        exit(-1)
    mb_size = 16
    for i in range(num):
        # 随机选一幅图
        idx = randint(0, l1 - 1)
        # 随机选一个区域来生成图片
        (startx, starty) = start[idx]
        (endx, endy) = end[idx]
        x = randint(startx, endx - 16)
        y = randint(starty, endy - 16)
        filename = path + ("%d.bmp" % i)
        img = Image.fromarray(np.uint8(com_y[y: y + mb_size, x: x + mb_size]))
        img.save(filename)

def save_text(y, start, end, training =

最低0.47元/天解锁文章

xgbm_k

关注

1
点赞
踩
92

收藏

觉得还不错? 一键收藏
0
评论
用卷积神经网络（CNN）识别文字

好久没有写博客了，趁最近比较闲来发一篇。有个项目：从计算机屏幕上截图识别截图上的文字早先识别的方法是：对比度颜色边缘检测问题是：有些图片会被识别为文字。前几天闲着就试了一下用卷积神经网络（CNN）来实现这个功能。生成训练集、测试集和验证集。首先，拿到一幅带有文字的计算机画面，用工具找到文字区域的起始和终止坐标，再用工具找到图片区域的起始和终止坐标。用下面的代码生成训练...
复制链接

扫一扫

专栏目录