caffe 将三通道或四通道图片转换为lmdb格式,将标签(单通道灰度图)转换为lmdb格式

import numpy as np
import lmdb
from PIL import Image
import sys


# import caffe module
caffe_root = '/home/user/SegNet/caffe-segnet/'
sys.path.insert(0, caffe_root + 'python')
import caffe


# # read file
train_file = open('/home/user/train.txt')
inputs_data_train = train_file.readlines()
train_file.close()


print("Creating Training Data LMDB File ..... ")
in_db = lmdb.open('/home/user/Val_Data_lmdb', map_size=int(1e12))
with in_db.begin(write=True) as in_txn:
    for in_idx, in_ in enumerate(inputs_data_train):
        # print in_idx
        in_ = in_.strip()
        im = np.array(Image.open(in_))
        Dtype = im.dtype
        if im.shape[2]== 3:
            print('The image has 3 channel')
            # RGB to BGR
            im = im[:, :, ::-1]
        if im.shape[2]==4:
            im3 = im[:,:,0:3]
            im3 = np.array(im3)
            #RGB to BGR
            im3 = im3[:,:,::-1]
            im[:, :, 0] = im3[:, :, 0]
            im[:, :, 1] = im3[:, :, 1]
            im[:, :, 2] = im3[:, :, 2]
        im = Image.fromarray(im)
        im = np.array(im, Dtype)
        im = im.transpose((2, 0, 1))
        im_dat = caffe.io.array_to_datum(im)
        in_txn.put('{:0>10d}'.format(in_idx), im_dat.SerializeToString())
in_db.close()


# read file
label_file = open('/home/user/trainannot.txt')
inputs_data_label = label_file.readlines()
label_file.close()


print("Creating Training Label LMDB File ..... ")
#map_size:Change the maximum size of the map file
in_db1 = lmdb.open('//home/user/Val_Label_Data_lmdb',map_size=int(1e12))
with in_db1.begin(write=True) as in_txn:
    for in_idx, in_ in enumerate(inputs_data_label):
        in_ = in_.strip()
        Dtype = 'uint8'
        L = np.array(Image.open(in_), Dtype)
        Limg = Image.fromarray(L)
        L = np.array(Limg,Dtype)
        L = L.reshape(L.shape[0],L.shape[1],1)
        L = L.transpose((2,0,1))
        L_dat = caffe.io.array_to_datum(L)
        in_txn.put('{:0>10d}'.format(in_idx),L_dat.SerializeToString())
in_db1.close()


print("Finish creating lmdb file ......")
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
将LaSOT数据集转换LMDB格式的步骤如下: 1. 首先,需要下载并解压缩LaSOT数据集。您可以从以下链接下载数据集:http://vision.cs.stonybrook.edu/~lasot/download.php 2. 然后,您需要安装LMDB库。您可以从以下链接下载并安装LMDB库:https://github.com/LMDB/lmdb 3. 接下来,您需要使用脚本将LaSOT数据集转换LMDB格式。以下是一个示例脚本: ``` import lmdb import os import cv2 import numpy as np def prepare_lmdb_data(data_dir, lmdb_file): env = lmdb.Environment(lmdb_file, map_size=int(1e12)) txn = env.begin(write=True) for root, dirs, files in os.walk(data_dir): for file in files: if file.endswith(".jpg"): video_name = os.path.basename(root) frame_name = os.path.splitext(file)[0] img_path = os.path.join(root, file) img = cv2.imread(img_path) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 将图像转换LMDB格式 datum = caffe.proto.caffe_pb2.Datum() datum.channels = 3 datum.height = img.shape[0] datum.width = img.shape[1] datum.data = img.tobytes() datum.label = -1 key = (video_name + "/" + frame_name).encode("ascii") txn.put(key, datum.SerializeToString()) txn.commit() env.close() if __name__ == "__main__": data_dir = "/path/to/LaSOT/dataset" lmdb_file = "/path/to/LaSOT/lmdb" prepare_lmdb_data(data_dir, lmdb_file) ``` 4. 运行脚本,将LaSOT数据集转换LMDB格式。请注意,此过程需要一些时间和计算资源,具体取决于数据集的大小和您的计算机性能。 5. 转换完成后,您可以使用LMDB库读取和处理数据集。以下是一个示例代码片段: ``` import lmdb import caffe env = lmdb.open('/path/to/LaSOT/lmdb', readonly=True) with env.begin() as txn: cursor = txn.cursor() for key, value in cursor: datum = caffe.proto.caffe_pb2.Datum() datum.ParseFromString(value) img = np.fromstring(datum.data, dtype=np.uint8).reshape(datum.channels, datum.height, datum.width) img = img.transpose((1, 2, 0)) # 转换为RGB格式 label = datum.label # 处理图像和标签 env.close() ``` 希望这可以帮助您将LaSOT数据集转换LMDB格式
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值