计算机视觉方向面试题总结(三):OCR篇
于 2023-04-28 14:36:51 首次发布
本文是计算机视觉面试题总结系列的OCR篇,涵盖了OCR的基础理论、数据集、模型训练调优、预测部署等方面。讨论了基于深度学习的文字检测方法,如CTPN、TextBoxes、EAST、CRAFT等,以及CTC和Attention在中文识别中的应用。此外,还探讨了TPS在弯曲文字识别中的作用,以及OCR领域的评估指标,如检测和识别阶段的准确率和召回率。最后,文章提到了多语种识别、数据集合成策略、模型训练中的技巧和部署问题。
摘要由CSDN通过智能技术生成