人工数据合成 人工数据合成主要有两个方法。 一、从零开始创建数据 二、已有数据集,进行扩充 可以对图片等添加噪声,或者图片变形、引入失真等。 三、上限分析 例如照片OCR,对于一个系统由几个部分组成。 首先是求出整体系统的准确率,然后逐步让每个部分表现最好,得出此时的准确率,这样就能发现我改进谁,谁就能最大限度的提升整体系统性能。 可以看出,1-2提升了17,2-3提升了1,3-4提升了10。因此文本检测和字符识别能够较好的提升系统性能,而不需要花费很大精力去完善字符切割。