BoW基本简介
Bag of words模型最初被用在文本分类中,将文档表示成特征矢量。它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的。
1、词典生成流程
在目前流行的SLAM过程中,但凡用了回环检测的,基本上都使用了BoW,包括号称鲁棒与效果兼备的ORB_SLAM;使用词袋模型分为两个步骤,产生一个词典,然后利用这个词典,前者是离线生成的,注意是离线生成的(就像小时候看书的时候还没认识那么多字,但是想看书,怎么办,去书店买一本词典吧,一遍读,一遍看;可能这个比方不是很恰当);在后面的步骤中,需要产生一个数据库,用了记录一下查词典时所用到的单词,方便回来看的时候能快速找到,不用辛辛苦苦的再去找一遍。
在实际使用的过程中,第一步我们得训练产生一本词典,就像前面提到的那样,单词就是一些特征聚类的结果。摆在我们面前的可能是几十万甚至几百万张训练的图片,我们需要依次提取特征,这真是个浩大的工程,然后在特征空间中就会有n多个特征信息,接下来我们要用这些特征聚类产生单词了,聚类成多少?这是个问题,这取决于我们选择的树形结构(后面会提到),整个过程就像下面图一样
黑色的就是最原始的,提取到的特征,为了简单&