使用Python读取数据需要注意的问题:
- 输入网络的数据格式:(样本数,size,size,channel)
- TensorFlow:channel_first
- Theano:channel_last
- 读取图片:cv2.imread() 默认RGB 3通道,读取灰度图则加上cv2.IMREAD_GRAYSCALE
- 读取txt文件:file.read().splitlines() 去换行符
- 读取Excel中的数字,会将整数读成小数,因此数据应该使用文本类型存储,在Excel中数字前面加英文的逗号,再删去,即可变为文本类型。或者设置文本类型后按F2(编辑)+Enter(下一列),可以快速将数字类型改为文本类型
- CASME II数据集中的preprocessed_Li Xiaobai 中有几个样本的视频帧索引与raw_selected中的不同,需要进一步处理
- 遍历文件夹下的所有图片:frames = glob(os.path.join(frame_path, ‘*.jpg’)) 其中,星号表示多个任意字符
网络设计和调参需要考虑的问题:
- 修改网络的batch_size 和lr 对精度的影响很大
- 数据需要进行归一化,亮度差异会导致网络动荡
- 网络设计的原则,以及针对不同数据网络大小深浅如何确定?(复杂的任务用浅的网络会导致不收敛,小样本训练用深的网络容易过拟合)