1.处理数据(图片与标签文件一一对应)
2.识别验证码:从tfrecords读取,每一张图片和其label对应,一次读取100张,数据shape为[100, 20, 80, 3], 张数,图片的高,宽,channel; 建立模型,直接将数据输入模型; 建立损失,softmax,求交叉熵; 梯度优化
eg:
import tensorflow as tf
tf.app.flags.DEFINE_integer(“batch_size”, 100, “每批次训练的样本数”)
tf.app.flags.DEFINE_string(“captcha_dir”, “./tfrecords…”, “验证码数据保存路径”)
tf.app.flags.DEFINE_integer(“letter”,26,“每个目标值可能取得的字母个数”)
tf.app.flags.DEFINE_integer(“label_num”,4,“每个样本目标值数量”)
#这样写是为了以后代码好改
def read_and_decode():
#读取验证码数据API,返回image_batch, label_batch
#1.构建文件队列
file_queue=tf.train.string_input_producer([FLAGS.captcha_dir])
#2.构建阅读器,读取文件内容,默认一次读一个样本
reader=tf.TFReader()
#3.读取内容,这里value是tfrecords中example格式,是需要解析的
#这里内部features是string,所以外面的feature也是string格式
key,value=reader.read(file_queue)
features&