写一个练手的验证码识别项目
数据集和完整代码我会传到我的下载资源
这篇文章是项目第一步,创建tfrecords文件
# 代码逻辑
1.读取图片文件
2.读取csv文件
3.处理一下读取好的csv文件到数字张量
4.写入tfrecords文件
1.读取图片文件
1.创建文件队列
2.构造阅读器取读取文件内容
3.选择相应的文件解码器取decode
4.要根据验证码的尺寸取setshape,因为读取过来的是一起读过来的
5.批处理数据
def get_image():
"""
获取验证码图片内容
:return: 批处理
"""
file_name = os.listdir("./yz/train10000")
# 构造路径加文件名
file_list = [os.path.join(FLAGS.captcha_dir, file) for file in file_name]
# 构造文件队列
file_queue = tf.train.string_input_producer(file_list, shuffle=False)
# 构造阅读器
reader = tf.WholeFileReader()
# 读取文件内容
key, value = reader.read(file_queue)
# 解码文件数据
image = tf.image.decode_jpeg(value)
image.set_shape([180, 60, 3])
# 批处理数据
image_batch = tf.train.batch([image], batch_size=10318, num_threads=1, capacity=10318)
return image_batch