总体设想:
根据前面对古文字的文法学习和已有的基于曲率的古文字特征提取与相似度比较,可以制作出一个类似现代汉字的文字识别功能。因为对同一个字,古代不同史官的笔迹必定不同,通过这个文字识别,可以直接把古文字翻译成现代文,但是缺点是语义不连贯,也可以只制作单字识别。
具体实现:
1.对每个文字的特征用一张图来记录,这张图的制作流程详见第二篇博客
2.在第一篇博客介绍建立的文字库中,加入每个标准文字曲率特征属性
3.对待检测文字用同样的方法建立特征图像
4.利用已有数据设置测试集,找到最佳阈值,将相似度大于阈值的视为同一个字
5.如果要实现文章的翻译,可以使用OCR分割成单字之后重复上述方法
学习时间:
2021-7-23
总结:
因为距离交付时间以经不长了这里只是叙述一下,实现时间不够,并没有具体去实现,其可行性也并无保证