"""
@author: wangquaxiu
@time: 2018/8/27 19:13
"""
import glob
import os.path
import random
import numpy as np
import tensorflow as tf
from tensorflow.python.platform import gfile
# Inception-v3模型瓶颈层的节点个数
BOTTLENECK_TENSOR_SIZE = 2048
# Inception-v3模型中代表瓶颈层结果的张量名称。在谷歌提供的Inception-v3模型中,这
# 个张量名称就是'pool_3/_reshape:0'。在训练模型时,可以通过tensor.name来获取张量的名称。
BOTTLENECK_TENSOR_NAME = 'pool_3/_reshape:0'
# 图像输入张量多对应的名称。
JPEG_DATA_TENSOR_NAME = 'DecodeJpeg/contents:0'
# 下载的谷歌训练好的Inception-v3模型文件目录。
MODEL_DIR = 'path/to/model'
# 下载的谷歌训练好的Inception-v3模型文件名
MODEL_FILE = 'tensorflow_inception_graph.pb'
# 因为一个训练数据会被使用多次,所以可以将原始图像通过Inception-v3模型计算得到
# 的特征向量保存在文件中,免去重复计算。下面的变量定义了这些文件的存放地址。
CACHE_DIR = 'tmp/bottlebeck'
# 图片数据文件夹。在这个文件夹中每一个子文件夹代表了一个需要区分的类别,每个子文件夹中
# 存放了对应类别的图片。
INPUT_DATA = 'path/to/flower_data'
# 验证的数据百分比。
VALIDATION_PERCENTAGE = 10
# 测试的数据百分比
TEST_PRECENTAGE = 10
# 定义神经网络的设置。
LEARNING_RATE = 0.01
STEPS = 4000
BATCH = 100
# 这个函数从数据文件夹中读取所有的图片列表并按照训练、验证、测试数据分开。
# testing_percentage和validation_percentage参数指定了测试数据集和验证数据集的
# 大小
def create_image_lists(testing_percentage, validation_perscentage):
# 得到的所有图片都存在result这个字典(dictionary)里。这个字典的key为类别名称,
# value也是一个字典,字典里储存;了所有图片的名称。
result = {}
# 获取当前目录下所有的子目录。
sub_dirs = [x[0] for x in os.walk(INPUT_DATA)]
# 得到的第一个目录是当前目录,不需要考虑。
is_root_dir = True
for sub_dir in sub_dirs:
if is_root_dir:
is_root_dir = False
continue
# 获取当前目录下所有的有效图片文件
extensions = ['jpg', 'jpeg', 'JPG', 'JPEG']
file_list = []
dir_name = os.path.basename((sub_dir))
for extension in extensions:
file_glob = os.path.join(INPUT_DATA, dir_name, '*.' + extension)
file_list.extend(glob.glob(file_glob))
if not file_list:
continue
# 通过目录名称获取类别的名称
label_name = dir_name.lower()
# 初始化当前类别的训练数据集、测试数据集和验证数据集。
training_images = []
testing_images = []
validation_images = []
for file_name in file_list:
base_name = os.path.basename(file_name)
# 随即将数据分到训练数据集、测试数据集和验证数据集。
chance = np.random.randint(100)
if chance < validation_perscentage:
validation_images.append(base_name)
elif chance < (testing_percentage + validation_perscentage):
testing_images.append(base_name)
else:
training_images.append(base_name)
# 将当前类别的数据放入结果字典。
result[label_name] = {
'dir': dir_name,
'training': training_images,
'testing': testing_images,
'validation&
Tensorflow Inception-v3模型迁移学习
最新推荐文章于 2021-09-17 21:06:43 发布