txt结果文件的原理:
将视频每一帧抽出变成一张图片进行目标检测处理时,会基于图片左上角为坐标原点,给图像里的每一个人加上矩形框,而矩形框左上角的对应x,y坐标,以及矩形框的宽高等等其他坐标信息,加上目标追踪时标记的不同人的不同id,就是该txt文件。
但fairmot会对每一张图片经过resize处理,假设原视频的尺寸为(1173,688),但fairmot里会将图片resize成(1980,1080),那么生成的txt结果文件,也就是每一个人的矩形框坐标信息,是基于(1980,1080)的,而不是基于原先的(1173,688),,所以用原视频和生成的txt结果文件进行比对时会产生不适配的错误。