这里继上篇利用迁移学习resnet训练计算题后,对于如果有多位或者不定长位数的验证码问题难以解决了,所以采用RNN解决不定长序列的计算题验证码问题,这种解决方式同样适用于不定长4,6位验证码,接下来看详细步骤
准备数据集,我的数据集是这样的,数据集总数有将近上万张多张大概有三四张类型,所有的特征是[“零”, “一”, “二”, “三”, “四”, “五”, “六”, “七”, “八”, “九”, “加”, “减”, “乘”, “除”, “等”, “于”, “?”, “以”],我这里还没有两位数及以上的计算题,有的话,再加一点特征其实是一样的,为什么我这里即使没有两位数,也用了RCNN呢,主要是为了兼容一种数据集,就是乘、乘以、除、除以,这个符号的中文是不定长的,也没有多少数据集,当然,需要数据集的话,私聊博主就可以,文章每一节,我会贴出所有代码,代码非常详细清晰。
1、搭建数据Loader
这里搭建数据loader与之前的 文章有所类似,里面的数据处理随便搞,主要是最后输出的数据格式和标签格式,这里最后用6位字符作为标签,举个例子,如果是一加一等于,那么就在