python读取jpg文件标签_keras 读取多标签图像数据方式

最新推荐文章于 2023-02-11 23:36:14 发布

weixin_39963341

最新推荐文章于 2023-02-11 23:36:14 发布

阅读量417

点赞数

文章标签： python读取jpg文件标签

我所接触的多标签数据，主要包括两类：

1、一张图片属于多个标签，比如，data:一件蓝色的上衣图片.jpg，label:蓝色，上衣。其中label包括两类标签，label1第一类：上衣，裤子，外套。label2第二类，蓝色，黑色，红色。这样两个输出label1，label2都是是分类，我们可以直接把label1和label2整合为一个label，直接编码，比如[蓝色，上衣]编码为[011011]。这样模型的输出也只需要一个输出。实现了多分类。

2、一张图片属于多个标签，但是几个标签不全是分类。比如data：一张结婚现场的图片.jpg,label:高兴，3(表示高兴程度)。这时label1是分类，label2时回归。这种情况就需要多个标签，模型需要多个输出。【其实最好的例子，就是目标检测，不但检测什么物体(分类)，还要检测到物体的坐标(回归)】

在这里我主要针对第二种情况加以说明：

keras的ImageDataGenerator.flow_from_directory 只能简单的读取单标签数据。所以我自己写了个data_generate，来生成bathsize多标签数据

#此模块主要用来读取数据集，返回一个数据可迭代对象

#重点是，此模块分批次的把图像读入内存的，而不是一次全读入，有效的减少了内存溢出

import os

import cv2

import numpy as np

import keras

from random import shuffle

#目标图像大小

image_size= (229, 229, 3)

#类别编码

class_dict=dict(zip(['neg','pos','neu'],[0,1,2]))

#处理.txt文件,并加载图片文件夹里的图片名

#txt_path，txt文件路径，data_path，图片文件夹路径

def read_txt(txt_path,data_path):

# 中间数组

labels_class = []

labels_score = []

with open(txt_path) as f:

lines_list = f.readlines()

for lines in lines_list:

line = lines.split(' ')

labels_class.append(line[0].rstrip(".jpg"))

labels_score.append(line[2])

labels_dict=dict(zip(labels_class,labels_score))

#处理图片数据集

all_picture_name = os.listdir(data_path)

#打乱数据集

shuffle(all_picture_name)

all_picture_path=[os.path.join(data_path,one)for one in all_picture_name]

return all_picture_name,all_picture_path,labels_dict

class data_generate:

def __init__(self,all_piture_name,all_picture_path,labels_dict,batch_size):

self.index=0

self.all_picture_name=all_piture_name

self.all_picture_path=all_picture_path

self.labels_dict=labels_dict

self.batch_size = batch_size

def get_mini_batch(self):

while True:

batch_images=[]

batch_labels=[]

batch_class=[]

batch_score=[]

for i in range(self.batch_size):

if(self.index==len(self.all_picture_name)):

self.index=0

bgr_image = cv2.imread(self.all_picture_path[self.index])

if len(bgr_image.shape) == 2: # 若是灰度图则转为三通道

bgr_image = cv2.cvtColor(bgr_image, cv2.COLOR_GRAY2BGR)

rgb_image = cv2.cvtColor(bgr_image, cv2.COLOR_BGR2RGB)

rgb_image=cv2.resize(rgb_image,(image_size[0], image_size[1]))

img = np.array(rgb_image)

img=keras.applications.inception_v3.preprocess_input(img)

batch_images.append(img)

#label=[]

label1=self.all_picture_name[self.index].rstrip(".jpg")

batch_class.append(keras.utils.to_categorical(class_dict[label1[:3]], 3))

batch_score.append(np.array(self.labels_dict[label1]))

#batch_labels.append(label)

self.index+=1

batch_images=np.array(batch_images)

batch_class = np.array(batch_class)

batch_score = np.array(batch_score)

#注意label的生成batch_class，一个单独数组，batch_score一个单独的数组

'''

注释掉的这段代码生成的label是错误的。

batch_images=[]

batch_labels=[]

for i in range(self.batch_size):

if(self.index==len(self.images)):

self.index=0

batch_images.append(self.images[self.index])

batch_labels.append(self.labels[self.index])

self.index+=1

batch_images=np.array(batch_images)

batch_labels=np.array(batch_labels)

yield batch_images,batch_labels

'''

yield batch_images,[batch_class,batch_score]

接下来就是放入keras.fit_generate中了

history=model.fit_generator(generator=train_data.get_mini_batch(),

steps_per_epoch=146,

epochs=300,

validation_data=test_data.get_mini_batch(),

validation_steps=34,

)

以上这篇keras 读取多标签图像数据方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

weixin_39963341

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python读取jpg文件标签_keras 读取多标签图像数据方式

我所接触的多标签数据，主要包括两类：1、一张图片属于多个标签，比如，data:一件蓝色的上衣图片.jpg，label:蓝色，上衣。其中label包括两类标签，label1第一类：上衣，裤子，外套。label2第二类，蓝色，黑色，红色。这样两个输出label1，label2都是是分类，我们可以直接把label1和label2整合为一个label，直接编码，比如[蓝色，上衣]编码为[011011]。这...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。