应用OFFICE的OCR控件MODI，怎么使识别出来的文本保留格式

最新推荐文章于 2024-08-17 10:17:06 发布

ryb666666

最新推荐文章于 2024-08-17 10:17:06 发布

阅读量2.6k

点赞数

分类专栏：小功能很有用的东东 OCR 文章标签： OCR

小功能同时被 3 个专栏收录

10 篇文章 0 订阅

订阅专栏

OCR

7 篇文章 0 订阅

订阅专栏

很有用的东东

6 篇文章 0 订阅

订阅专栏

我用MODI识别图像文件，识别出来的文本都是一个挨着一个的，不含有原来的格式怎么改进下能使其还有原来的格式
这是我用的代码：
private string Recognition(string strFileName)
        {
            string strResult = string.Empty;            // 宣告 MODI.Document 物件 modiDocument，并且实例化
            MODI.Document modiDocument = new MODI.Document();            // MODI.Document 创建
            modiDocument.Create(strFileName);            // 宣告 MODI.Image 物件 modiImage，其內容值来自 MODI.Document 物件 modiDocument
            MODI.Image modiImage = (MODI.Image)modiDocument.Images[0];            // OCR Method(Language, WithAutoRotation, WithStraightenImage)
            modiImage.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, false, false);            // 組合 OCR 识别后的 Word
            foreach (MODI.Word WordItem in modiImage.Layout.Words)
            {
                strResult += WordItem.Text;
            }
            modiDocument.Close(false);            // 回传识别结果
            return strResult;

}

转载地址：http://www.debugease.com/csharp/1138172.html