1 高斯模糊采用分离滤波器,滤波器的长度容许截断误差2 X 4 + 1
2 Alloc blurBuf, diffBuf in global memory, diffBuf can be used as temp buffer for seperate filter
3 求局部极值点,可以先求邻域内的最值,然后中心点值与最值比较,以确认其是否为极值点
4 改变极值点过滤方案,先要求关键点满足边界响应要求,然后进行Hessian矩阵定位,可以减少计算量
5 极值点插值算法迭代一次即可满足要求?
6 关于Hessian矩阵求解是否有更好的优化方案?此处share memory提供快速IO, 内部计算时?
7 octave间计算的可并行性
8 多图像特征提取时时采用多线程实现多流异步机制,实现GPU卡的满负荷运作(此处要注意每个线程可用最大显存的合理分配)
9 特征点的第二个主方向确认可以在CPU端完成(是否有更好的GPU端解决方案)
10 描述子的生成需要验证GPU端与多线程模式的CPU端算法那个更有优势!
11 绝对值代替平方根?或者采用平方根近似求解方案?
12 图像上/下采样采用更优的GPU核优化
13 输入图像灰度图采用GPU优化方案,则CudaImage赋值时不再需要上传灰度图到GPU,速度肯定有提高
另:是否完整提交关于cudaSift的代码解析(晚些时候再启动,暂时时间紧张)