一、需求
在GazeCapture数据集中,有两个记录了注视点坐标的数据文件train_y.npy和val_y.npy,这其中存放的并不是图像数据,而是点的位置信息,与之前的需求有区别。在制作自己的训练集时,可以在txt文本文件中记录每张图片对应的屏幕注视点的位置信息,然后将其转化为.npz文件,以供训练。
二、txt文件转npz文件
2.1 查看train_y.npy文件内容
首先,以train_y.npy为例,我们可以利用python代码查看该文件的内容以及相关信息。
import numpy as np
# 加载文件
face_data=np.load('C:/Users/Lenovo/Desktop/eye_tracker_train_and_val.npz')
# 查看文件中保存的数据信息
print(type(face_data['train_y']))
print((face_data['train_y']).dtype)
print((face_data['train_y']).size)
print((face_data['train_y']).shape)
print((face_data['train_y']).ndim)
得到下面的结果:
<class 'numpy.ndarray'>
float64
96000
(48000, 2)
2
说明从该文件转化的数组是一个2维数组,其中存放了48000个1×2的位置信息,对应48000张图片注视的点的坐标,并且数组中元素的数据类型是float64。<