caffe学习笔记(11):多任务学习之HDF5Data类型数据集生成

这篇博客介绍了如何使用Caffe进行多任务学习,特别是数据集的构建,重点在于利用HDF5Data层处理多标签数据。内容包括HDF5Data数据集的.h5文件格式,以及因文件大小限制需要生成多个hdf5文件的情况。博主分享了MATLAB代码,用于创建list_train.txt和list_val.txt文件,并展示了如何对数据进行乱序处理,以生成训练和验证用的文件。
摘要由CSDN通过智能技术生成

最近开始研究多任务学习(multi-task learning, MTL),先分享给大家:
本文主要讲述数据集的建立,HDF5Data类型用于处理多标签数据,在网络中定义为:

layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  hdf5_data_param {
    source: "list_train.txt"
    batch_size: 1000
    shuffle: true
  }
}

HDF5Data类型数据集的格式为.h5。
list_train.txt 文件中存放训练数据集列表,list _val.txt文件同:
这里写图片描述

因为caffe中要求1个hdf5文件大小不超过2GB,所以如果数据量太大,需要生成多个hdf5文件
本人数据40M,生成的数据集800M。

matlab代码可参照:点击进入

制作train.txt,val.txt文件:
我的标签用了六个,如图:
这里写图片描述

代码如下:
代码完成任务:
1. 将整个数据集写入trainval.txt文件
这里写图片描述
2. 将trainval.txt文件中的图像乱序,生成trainval_re.txt
这里写图片描述
3. 根据trainval_re.txt生成train.txt,val.t

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值