代码链接:GitHub - yihuacheng/GazeTR: The codes and models in 'Gaze Estimation using Transformer, ICPR2022'.
项目主目录为GazeTR,在主目录下有许多子模块。以下为分模块解读。
config
config模块下有test和train俩个子模块,其中均为.yaml文件,分别是在四个gaze数据集下,对一些超参数的基本设置,以及数据集的存储路径。以训练gaze360数据集为例,相关设置如下:
reader
reader模块定义了一个用于读取数据的PyTorch数据加载器,用于加载和预处理训练用的图像和标签数据。
Decode_MPII、Decode_Diap、Decode_Gaze360、Decode_ETH和Decode_RTGene函数用于解析不同数据集的注释。它们将注释数据的一行作为输入,并返回一个包含相关字段(例如,面部图像文件名、2D凝视坐标等)作为键的字典对象。