暑假实训验证码识别day 4
今天研究了关于模型的建立(CNN)
大致教程(https://www.cnblogs.com/mtcnn/p/9411772.html)
见识并且了解了很多关于tensorflow类里的函数
根据教程和所了解的函数一步一步应该是搭建好了模型,但还没有训练集测试,(由于分割的高要求,所以这种识别方式对于验证码图片要求比较高,字符标准,无粘连)还没有找到方法能够解决
等预处理同学将处理过的验证码xml文件给我,应该就能进行模型的训练了。
但由于模型目前只能识别一个字符,对于四个字符的验证码的识别的解决方案目前有两种(待研究)
1.就是先通过预处理将所需要的测试的图片分割成4个图片,按顺序调用四次模型来识别。
2.第二种就是改善模型,使模型先识别一个字符,训练后再去识别四个字符的图片。
除此之外,对于分割的方法还有欠考虑,目前只是用了简单的全部分割将所有图片根据xml来分割并分类。如果测试一个预处理过的验证码,需要一个类方法将其分割。(如果能够实现上述第二种情况,则就不需要了分割了)
明日计划:
改善模型(训练模型)
寻找分割方法