tesseract 中文识别 笔记

游戏要出海外版本,图片里的中文字不想手动筛选,就想着弄一个中文识别
结论:大部分能识别出中文,但是游戏字体千变万化,识别结果不准确,比如按钮两个框可能识别成了吕,识别结果也是乱码
本来想着训练下样本让它准确一点,也没成功,最好还是拉出两个svn version的文件,让策划手工删选了

https://www.cnblogs.com/ITtangtang/p/3951240.html       ---- Imagemagick常用指令

1. 官方推荐的DPI是300以上,一般图片都是72
修改DPI,并且转换程tif格式图片,写入灰度,关掉透明度等操作
d:\ImageMagick\convert.exe -density 300 -compress none -depth 8 -alpha off -colorspace Gray ./code.gif ./code.tif
查询图片信息
magick identify -format %w%h .png  
图片切片
magick convert .png -crop 154x50 +repage .png

基本用法:
tesseract img img -l chi_sim
参考:
http:
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值