一 、项目的总体思路
小组实现了一个基于手写识别的计算工具。其基本功能如下:
①实现多个数字的手写识别
②实现加减乘除符号的识别
③输出手写识别的应用程序
起初,微软的工程师为我们提供了Mnist数据集和单个手写数字的窗体程序。尽管如此,小组仍面临着一些挑战。一是多个数字的分割识别,另一个是运算符号的识别(因为原数据及相关开源网站的资源都难尽人意)。对于第一个难点,从微软工程师那学习了分割算法的大致思路后,组员结合已有的图像处理知识,编写了相关函数。对于第二个难点,团队成员做了一个头脑风暴,整理出了两种方案:
①由于没有很多的字符数据集,所以另辟蹊径,使用了工程师们提供的在线训练模型的平台。(https://www.customvision.ai/projects)这个平台中,所训练的数据集无需很多,且能够简单地下载获取离线模型。
②利用tensorflow中的例程 mnist.py ,手工绘制运算符图片,编程扩充数据集,然后转换成符合 mnist.py 要求的数据集进行训练,得到一个可以识别数字和运算符的 model ,然后直接对分割后的图像进行识别。
二 、项目的时间进度
第一周周四:开始项目,小组组员挑选合适的课题并从软件工程师那里得到相关建议。
第一周周六:成功实现了图像分割算法,并能输入模型得到较为满意的识别结果。