https://blog.csdn.net/Uwr44UOuQcNsUQb60zk2/article/details/78957391
https://blog.csdn.net/qinhuai1994/article/details/78696353
https://blog.csdn.net/fzp95/article/details/81867190
https://blog.csdn.net/discoverer100/article/details/79758131
https://blog.csdn.net/discoverer100/article/details/79758131
mat文件下载:https://drive.google.com/file/d/0B7Awq_aAemXQcndzY3M5dkprVTA/view?usp=sharing
cfnet train部分流程图:https://blog.csdn.net/discoverer100/article/details/80929889
SimenseFC and CFNet 对比:https://blog.csdn.net/fzp95/article/details/81867190
DCF+Siamensee 可以参考:https://blog.csdn.net/shenziheng1/article/details/80878290
孪生网络发展总结:https://blog.csdn.net/haoji007/article/details/88387420
实验:
1.不同深度直接的对比
2.融合实验,为了证明假说:CF在训练中就融入会比跟踪时融入好
3.自适应实验,给了一个不变的CF层验证跟踪时候更新CF参数的必要
4.效果上,虽然效果不错,但是总觉得作者在刻意隐瞒什么,比如Baseline-conv3的结果没在这里写出来(速度精度可能高于CFNet-conv1),再比如SiamFC-3s在原论文里fps达到86(https://arxiv.org/abs/1606.09549)。
1.实验中其他模型数据问题
2.CF层的作用?
可以将x制作成一个对变化有鲁班性的区别模板
Its effect can be understood as crafting a discriminative template that is robust against translations.
可以理解为对测试时的先验知识编码,当获得足够的数据和容量时,这个先验知识变得冗余甚至是过度限制。
The CF layer can be understood to encode prior knowledge of the test-time procedure. This prior may become redundant or even overly restrictive when enough model capacity and data are available.
3.训练时的怎么解决缩放问题(还得细看代码)
bounding box怎么确定的
当前帧的BB属于前一帧得出的BB的三个尺度中的一种。得到上一帧的跟踪结果后,在下一帧跟踪时,会选取三个尺度的搜索图像(图像大小都是255x255,只是缩放比例不同,根据论文中那个裁剪公式),进行三次推断,最后比较三个结果的最大值,当前帧的BB就是最大值对应的那个尺度