【Python】Python读取mat数据集(COFW,300WLP),解析后训练模型用

笔者用到了人脸数据集COFW,300WLP,但文件都是mat文件,也搜了下资料,最终调通完美运行,这里记录下

Python读取文件的方式主要有两种:

由于mat文件是有MATLAB生成的,所以 7.3 以上的用方法2,版本7.3以下的用方法1,反之会报错!

  • 方法1: from scipy.io import loadmat

mat_path是mat文件的路径,格式为字符串
路径格式:
‘/media/cxx/AEDAFE58DAFE1BF11/lcswork/align_dataset/300W-LP/300W-LP/300W_LP/AFW/AFW_1051618982_1_0.mat’

c_mat = loadmat(mat_path)

打印下keys()

print(c_mat.keys())

输出结果

#dict_keys(['__header__', '__version__', '__globals__', 'pt2d', 'roi', 
# 'Illum_Para', 'Color_Para', 'Tex_Para', 'Shape_Para', 'Exp_Para', 'Pose_Para'])

这里想要获取,landmarks,先用 c_mat[‘pt2d’]得到值,再transpose,将矩阵转置,再转化成numpy格式后,再做reshape,就是想到的成对的坐标

landmarks = np.array(np.transpose(c_mat['pt2d'])).astype('float').reshape(-1, 2)

直接打印即可,格式已经是numpy了

300WLP 的图片全是jpg,加载到dataloader时,直接调取路径即可

  • 方法2:import h5py

方法2主要针对的是COFW数据集,所有的图片已经转化成矩阵存在mat结构中了,需要转换可视化

cofw_mat 是mat文件的路径,格式是字符串

c_mat = h5py.File(cofw_mat,'r')

打印下keys

print(c_mat.keys())

输出结果

<KeysViewHDF5 ['#refs#', 'IsTr', 'bboxesTr', 'phisTr']>

图片对应的key是 IsTr,打印key对应的就是图片内容,依然需要transpose

images = np.transpose(c_mat['IsTr'])

不过想要显示图片,还有一步操作,就是回去调值

image = np.transpose(train_mat[images[0]][:])
plt.imshow(image)
plt.show()

在这里插入图片描述
如果还要显示对应的landmarks,直接打印相应的key就可以,转置后直接可用,这时候的格式是元组(a,b)

phisTr = np.transpose(c_mat['phisTr'])

最后放上一张,批处理读取,landmarks转化为5个关键点后的图片
在这里插入图片描述

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值