Tesseract 识别率有点低,使用nuget直接加载 Tesseract,简单几行代码就可以识别图片中的文字
using (TesseractEngine engine = new TesseractEngine("C:\\tessdata_chi_sim-master\\best", "chi_sim", EngineMode.Default))
{
using (var img = Pix.LoadFromFile("c:\\1.jpg"))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
return text;
}
}
}
如果需要提高识别率也可以自己训练字库