Tesseract.js离线识别图片中的文字

最新推荐文章于 2024-05-10 01:00:00 发布

北苇渡江

最新推荐文章于 2024-05-10 01:00:00 发布

阅读量1.4k

点赞数

文章标签： javascript 图片识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40184195/article/details/130704340

版权

从官网下载Tesseract.js的离线版本

https://github.com/jeromewu/tesseract.js-offline

初始化

解压下载文件
使用cmd命令行进入解压的文件夹（tesseract.js-offline-master），使用命令下载安装相关包
```
npm install
```
下载安装完成后，该目录文件夹下多了一个名为node_modules的文件夹，这个文件夹下的东西就是刚刚安装下载的东西，其中包含了所有文字识别需要的组件及库。

下载中文识别包

tesseract.js的语言包下载地址为：https://github.com/naptha/tessdata/tree/gh-pages/4.0.0
进入该网址，下载对应的中文语言包，具体名称为chi_sim.traineddata.gz
下载完成后，将该文件放到tesseract.js-offline-master\lang-data文件夹下，该文件夹存放了所有语言识别包文件。

修改代码

仿照英文示例（tesseract.js-offline-master\browser\index.html），修改相应的代码，实现识别中文
在这里插入图片描述

运行程序

npm run start

这时服务器已经启动，在浏览器中输入http://localhost:3000/browser/index.chi_sim.html
打开控制台，查看识别结果

参考文章

深度学习——使用Tesseract.js在浏览器离线识别图片中的文字

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Tesseract.js离线识别图片中的文字

Tesseract.js离线识别图片中文
复制链接

扫一扫

北苇渡江 CSDN认证博客专家 CSDN认证企业博客

码龄7年

52: 原创

43万+: 周排名

6万+: 总排名

5万+: 访问

: 等级

937: 积分

31: 粉丝

53: 获赞

15: 评论

107: 收藏

私信

关注

热门文章

分类专栏

项目管理 3篇
办公软件
Excel 2篇
编辑器 2篇
前端 4篇
前端框架 2篇
Linux 4篇
中间件 5篇
Java 11篇
Java基础 4篇
算法 1篇
jvm 1篇
数据库 7篇
数据库管理工具 1篇

最新评论

mybatis问题汇总
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数。
DB2数据库问题总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性。
Nginx学习总结
CSDN-Ada助手: 努力是会上瘾的，特别是尝到甜头之后。
IDEA问题总结
CSDN-Ada助手: 是否能谈谈Java的反射机制？
在SSM项目中未配置spring事务管理却实现了自动提交
lgzzk: 添加了事务应该会拦了，最好检查一下mysql表类型是不是InnoDB，否则不支持回滚

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。