写在前面
- 感受野的本质是,某一层特征图中的某一cell对应原始输入的响应大小区域。自底向上推导出原图中的响应。
- 感受野可以告诉我们在某一层做的事受原始输入的影响有多大。比如语义分割会用到,对pixel的分类,要看pixel周围的pixel。
文章目录
关键问题:特征提取
ML的feature extraction是由人工的提取,然后丢进机器算法比如SVM里面去做,SVM需要输入一个特征向量。
DL的feature extraction是端到端的,隐含在了network frame里。
Content-based image Retrieval(CBIR)Framework 特征提取常和hash融合在一起,将提取出来的特征hashing code。为了提高搜索速度。
Bag-of-Visual-Words (词袋模型) for CV
visual object representation: Bag of visual words
Visual Word = Local Feature
local feature由坐标位置(x,y)和descriptor组成。
SIFT
几何校验非常有名,用到了RANSAC