使用vgg16网络完成多标记分类任务代码(tensorflow框架)

最新推荐文章于 2023-09-26 11:22:09 发布

VIP文章上进的小菜鸟

最新推荐文章于 2023-09-26 11:22:09 发布

阅读量1.5k

点赞数 2

分类专栏：深度学习分类网络 tensorflow 文章标签： vgg16训练多标记分类数据集代码多标记分类任务代码读取多标记数据集 tfrecords存储多标记数据集 vgg16多标记分类网络

本文链接：https://blog.csdn.net/qq_35153620/article/details/102743153

版权

github下载链接：

https://github.com/A-mockingbird/VGG16ForMultilabelClassification

# 1.读取多标记分类数据集，将数据集分割，存储为tfrecords格式

新建文件

ReadMultilabelDataset.py

import json
import os
import random
import numpy as np
import tensorflow as tf
from PIL import Image

slim = tf.contrib.slim

def get_multilabel_dataset_dict(imagedir, class_name, train_percentage=8):
    """
    读取数据集，数据集存储格式：不同标记的图像放在一个文件下面，例如有三个分类：dog，house，car
    既有dog又有house的图像文件名为：dog+house
    返回字典，存储测试集和训练集图像及其标签和文件名
    """
    rootdir = imagedir
    #获取全部子文件名(标记)
    category = [x[1] for x in os.walk(imagedir)][0]
    dataset = {}
    #遍历全部子文件
    for j, cat in enumerate(category):
        #获取标签，例如dog+house就变成[1, 1, 0]
        sub_label = get_label(class_name, cat)
        subdir = os.path.join(rootdir, cat)
        imagelist = os.listdir(subdir)
        number = len(imagelist)
        train_dataset = []
        test_dataset = []
        print('{}: {}'.format(cat, sub_label))
        for i, image in enumerate(imagelist):
        #遍历图像
            #随机分为训练集和测试集
            r = random.randint(0, number)
            if r < number / 10.0 *train_percentage:
                train_dataset.append(image)
            else:
                test_dataset.append(image)
        #存入字典中
        dataset[cat] = {
            'dir':subdir,
            'label':sub_label, 
            'train':train_dataset,
            'test':test_dataset
        }
    return dataset

def get_label(class_name, cat):   
    #标签转换，转换向量形式
    label = []
    cls = cat.split('+')
    for i, x in enumerate(class_name):
        if x in cls:
            label.append(1)
        else:
            label.append(0)
    return label 

def int64_list_feature(value):
    return tf.train.Feature(int64_list=tf.train.Int64List(value=value))

def int64_feature(value):
    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))

def bytes_feature(value):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))

def create_tfrecord_example(label, imagefile, resize=None):
    #创建tfrecord的输入example
    #读取图像
    pil_image = Image.open(imagefile)
    #resize图像
    if resize != None:
        pil_image = pil_image.resize(resize)
    #将读取的图像转换为二进制格式
    bytes_image = pil_image.tobytes()
    #创建example（包含图像信息和标签信息）
    example = tf.train.Example(features=tf.train.Features(feature={
        'label': int64_list_feature(label), 
        'image': bytes_feature(bytes_image)
        #'format': bytes_feature('jpg')

最低0.47元/天解锁文章

上进的小菜鸟

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
3
评论
使用vgg16网络完成多标记分类任务代码(tensorflow框架)

github下载链接：https://github.com/A-mockingbird/VGG16ForMultilabelClassification# 1.读取多标记分类数据集，将数据集分割，存储为tfrecords格式新建文件ReadMultilabelDataset.pyimport jsonimport osimport randomimport numpy ...
复制链接

扫一扫