HTML5 JavaScript实现图片文字识别与提取

最新推荐文章于 2024-05-13 10:48:39 发布

shenzhenNBA

最新推荐文章于 2024-05-13 10:48:39 发布

阅读量8.9k

点赞数 1

分类专栏：管理者/开发者 JavaScript 文章标签：算法图形

管理者/开发者同时被 2 个专栏收录

190 篇文章 1 订阅

订阅专栏

60 篇文章 0 订阅

订阅专栏

牛人写的东西博客，转载一下，原文见 http://blog.csdn.net/coolanfei/article/details/11749833

HTML5 JavaScript实现图片文字识别与提取

思路

实现一个算法，思路是最重要的，而实现不过是把思想转化为能够运行的代码。
简单地说，要进行文本识别，自然是拿图片的数据与文字的图形数据进行对比，找到与图片数据匹配程度最高的字符。
首先，先确定图片中文本所用的字体、字号、行距等信息，打开PhotoShop，确定了字体为微软雅黑，16像素，行距为24，Base64文字的开始坐标为(8, 161)。
然后，确定要进行匹配的字库，Base64编码中可能出现的字符为26个字母大小写、10个数字、加号、斜杠，但目测在图片中没有斜杠出现，因此字库应该为：
0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ+
接着，是确定如何判断字符是否匹配，由于只需要对字型进行匹配，因此颜色值对算法并无用处，因此将其灰度化（详见百度百科），并使用01数组表示，1代表该像素点落在此字符图形上，0反之，而如何确定该某个灰度值在数组中应该表示为0还是1，这个转换公式更是算法中的关键。
最后，将字型的灰度化数据与图片中文字部分的灰度化数据进行对比，将误差最小的字型作为匹配到的字符，然后进行下一个字符的匹配，直到图片中所有字符匹配完毕为止。

1，递归实现
见原文...

2，非递归实现

见原文...

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
HTML5 JavaScript实现图片文字识别与提取

牛人写的东西博客，转载一下，原文见 http://blog.csdn.net/coolanfei/article/details/11749833HTML5 JavaScript实现图片文字识别与提取思路实现一个算法，思路是最重要的，而实现不过是把思想转化为能够运行的代码。简单地说，要进行文本识别，自然是拿图片的数据与文字的图形数据进行对比，找到与图片数据匹配程度最高的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。