游戏要出海外版本,图片里的中文字不想手动筛选,就想着弄一个中文识别
结论:大部分能识别出中文,但是游戏字体千变万化,识别结果不准确,比如按钮两个框可能识别成了吕,识别结果也是乱码
本来想着训练下样本让它准确一点,也没成功,最好还是拉出两个svn version的文件,让策划手工删选了
https://www.cnblogs.com/ITtangtang/p/3951240.html ---- Imagemagick常用指令
1. 官方推荐的DPI是300以上,一般图片都是72
修改DPI,并且转换程tif格式图片,写入灰度,关掉透明度等操作
d:\ImageMagick\convert.exe -density 300 -compress none -depth 8 -alpha off -colorspace Gray ./code.gif ./code.tif
查询图片信息
magick identify -format %w%h .png
图片切片
magick convert .png -crop 154x50 +repage .png
基本用法:
tesseract img img -l chi_sim
参考:
http: