caffe学习笔记(11):多任务学习之HDF5Data类型数据集生成

本文主要讲述数据集的建立,HDF5Data类型用于处理多标签数据。
摘要由CSDN通过智能技术生成

最近开始研究多任务学习(multi-task learning, MTL),先分享给大家:
本文主要讲述数据集的建立,HDF5Data类型用于处理多标签数据,在网络中定义为:

layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  hdf5_data_param {
    source: "list_train.txt"
    batch_size: 1000
    shuffle: true
  }
}

HDF5Data类型数据集的格式为.h5。
list_train.txt 文件中存放训练数据集列表,list _val.txt文件同:
这里写图片描述

因为caffe中要求1个hdf5文件大小不超过2GB,所以如果数据量太大,需要生成多个hdf5文件
本人数据40M,生成的数据集800M。

matlab代码可参照:点击进入

制作train.txt,val.txt文件:
我的标签用了六个,如图:
这里写图片描述

代码如下:
代码完成任务:
1. 将整个数据集写入trainval.txt文件
这里写图片描述
2. 将trainval.txt文件中的图像乱序,生成trainval_re.txt
这里写图片描述
3. 根据trainval_re.txt生成train.txt,val.t

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值