MXNET框架下打包及处理视频cityscpes为rec文件方法
在segmentation任务中,分为单帧图像的语义分割和视频的语义分割,单帧图像的语义分割所采用的数据集中的街景图片是离散的,是从总的视频数据集中所抽取的特定帧组成的,而视频语义分割则包含小街景视频中的所有图像。在训练集中,每一段小视频只有一帧存在精细的标注,所以我们在选择数据时,一般以带有标签的指定帧为no-key frame,以不带标签的某一帧为key frame,这样才能训练。所以以当前帧(指定帧)及其标签和关键帧组成一个数据对。
在使用MXNET打包时,需要使用MXIndexedRecordIO作为接口,将数据打包并记录其id,这样才能将视频图片与标签相对应。