我用MODI识别图像文件,识别出来的文本都是一个挨着一个的,不含有原来的格式 怎么改进下能使其还有原来的格式
这是我用的代码:
private string Recognition(string strFileName)
{
string strResult = string.Empty; // 宣告 MODI.Document 物件 modiDocument,并且实例化
MODI.Document modiDocument = new MODI.Document(); // MODI.Document 创建
modiDocument.Create(strFileName); // 宣告 MODI.Image 物件 modiImage,其內容值来自 MODI.Document 物件 modiDocument
MODI.Image modiImage = (MODI.Image)modiDocument.Images[0]; // OCR Method(Language, WithAutoRotation, WithStraightenImage)
modiImage.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, false, false); // 組合 OCR 识别后的 Word
foreach (MODI.Word WordItem in modiImage.Layout.Words)
{
strResult += WordItem.Text;
}
modiDocument.Close(false); // 回传识别结果
return strResult;
这是我用的代码:
private string Recognition(string strFileName)
{
string strResult = string.Empty; // 宣告 MODI.Document 物件 modiDocument,并且实例化
MODI.Document modiDocument = new MODI.Document(); // MODI.Document 创建
modiDocument.Create(strFileName); // 宣告 MODI.Image 物件 modiImage,其內容值来自 MODI.Document 物件 modiDocument
MODI.Image modiImage = (MODI.Image)modiDocument.Images[0]; // OCR Method(Language, WithAutoRotation, WithStraightenImage)
modiImage.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, false, false); // 組合 OCR 识别后的 Word
foreach (MODI.Word WordItem in modiImage.Layout.Words)
{
strResult += WordItem.Text;
}
modiDocument.Close(false); // 回传识别结果
return strResult;
}
转载地址:http://www.debugease.com/csharp/1138172.html