论文:detect to track and track to detect 读后感
断断续续看了一整天,大概看懂了其中的原理,作者设计了一个基于R-FCN的结构,类似于siamese网络,采用具有时间差的两帧作为输入,分别进行位置回归,分类和帧间位移的训练,这点从损失函数上也可看出。这个结构是端到端的,对于耗时那块儿没看太明白,到底是141s还是14s,依我之见应该是141秒,应为特征提取还是较为耗时的。总的来说效果还是不错的,作者对于两帧之间时间间距小产生的精度...
原创
2019-04-09 20:43:04 ·
399 阅读 ·
0 评论