tesseract-ocr .NET 识别图片中文字

github:http://​https://github.com/charlesw/tesseract​

例子: https://github.com/charlesw/tesseract-samples

语言数据文件github:https://github.com/tesseract-ocr/tessdata

语言数据文件下载:https://github.com/tesseract-ocr/tessdata/archive/refs/heads/main.zip 

使用步骤:

(1).在项目中Nuget包中添加“Tesseract”包。

(2)下载语言数据文件:https://github.com/tesseract-ocr/tessdata/archive/refs/heads/main.zip 

(3)在项目中新建文件夹名称为“tessdata”

(4)在下载的语言数据文件中找到“chi_sim.traineddata”文件,复制到“tessdata”文件夹中,设置“chi_sim.traineddata”“文件复制到输出目录”设置为“始终复制”。

(5)复制如下示例代码到程序中,并指定对应识别图片

示例代码:

using (var engine = new TesseractEngine(Server.MapPath(@"~/tessdata"), "chi_sim", EngineMode.Default))//英文是eng,简体中文是chi_sim
                {
                    // have to load Pix via a bitmap since Pix doesn't support loading a stream.
                    var path = @"ocr/xx.png";
                    using (var image = new System.Drawing.Bitmap(path))
                    {
                        using (var pix = PixConverter.ToPix(image))
                        {
                            using (var page = engine.Process(pix))
                            {
                                var meanConfidence = String.Format("{0:P}", page.GetMeanConfidence());
                                var resultText = page.GetText();
                                return Content("meanConfidence: " + meanConfidence + ",resultText" + resultText);
                            }
                        }
                    }
                }

注:tessdata文件夹下的语言数据文件“复制到输出目录”设置为“始终复制”。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值