从今天起准备把我的毕设的实现细节写到博客里面,一方面写一遍加深记忆,另一方面如果哪天忘记了查起来也方便
毕设题目是基于词汇树的无序图像集检索和支撑结构生成,其实提出词汇树那篇文章(Scalable Recognition with a Vocabulary Tree[1])已经是2006年的了,算是很老的文章,但是在大规模二三维重建的过程中快速的图像检索还是有意义的。
今天算是把整个程序怎么写彻底想通了,果然不能没有彻底相同就开始写代码。用力过猛容易闪着腰【高三暑假TAT
这个程序大概是这么个流程:(记录一下,无论是实验室寝室还是公司都可以查,不用老是带着那张草稿纸了)
1. 所有图像提特征(已经实现)
2. 建树(输入:所有特征,特征个数) (已经实现)
3. 将训练集图像转换成TF-IDF向量 (最麻烦的部分,正在写)
(1) 计算树中每个节点的IDF值 (输入:所有特征,一个记录每张图有多少特征的一位数组)
(2) 计算每张图的TF-IDF向量 (输入:指向起始特征的指针,特征数目)
(3) 将TF-IDF向量和对应的图像路径写入数据结构 (输入:TF-IDF向量和图像路径)
4. 查询
(1) 计算查询图像的TF-IDF向量 (输入:查询图像路径)
(2) 找到距离最近的数据库图像 (已经实现)
今天先说下什么叫做词汇树。
</