计算机视觉中物体分类是什么,基于计算机视觉的物体分类关键技术研究

摘要:

物体识别是当前国内外计算机视觉领域一个活跃的研究方向,物体识别的本质就是建立一个能够识别出图像中感兴趣物体类别的计算系统,在现实生活中有着广泛的应用需求,具有相当高的应用价值和研究意义.近年来,随着模式分类技术的不断成熟以及人工智能的持续发展,基于语义特征提取的物体识别技术逐渐被广大学者所接受.物体的语义特征就是通过提取一类物体的局部特征,然后按照一定的处理准则将局部特征转化为描述一类物体的语义信息,形成一类物体的语义特征模型,实现可行有效的物体分类识别效果. 由于物体图片的信息量大,计算复杂度高,如何利用物体有效的特征进行自动物体分类识别,目前算法在实际应用中面临很大的挑战性,本文首先总结物体识别的研究现状和目前存在的问题,介绍了物体识别与分类的算法基本框架,视觉不变性特征的比较,然后深入研究了SIFT的尺度分量所携带的信息,设计了两级匹配的层次聚类算法,有效的提高了匹配正确率.以此为基础,研究了SIFT的词袋算法框架,通过支持向量机选择视觉词汇的特征点,实验表明,性能优于k均值聚类算法.最后完整的描述了系统的实验过程,分析了实验结论,证明了本文提出算法的有效性. 本文在视觉物体分类和识别的研究中,主要的研究内容和创新点如下: (1)基于尺度分量的两级SIFT特征匹配算法 在物体分类中,SIFT特征具有尺度空间不变性,一般的应用中,直接在全部样本空间实现全搜索,基于最近邻和次近邻比值门限来判断是否匹配成功,该方法带来两个问题,一是误匹配,二是无法回避物体内部的自相似特征点.本文分析了同类物体在不同相机参数下的匹配特征点尺度关系,计算观测物体的相对尺度,设计两级匹配方法,将尺度分量用于决策过程,提高匹配的精度和效率. (2)基于SVM的视觉词汇生成方法 现有Bag of Words算法以描述符的聚类中心作为视觉单词,但是该方法会产生严重的语义丢失现象.本文提出了两种基于决策机制的视觉单词生成方法,通过决策机制,选取若干类内有效特征点代替聚类中心,形成语义丰富的视觉单词,丰富了视觉词汇表中的语义信息,提高了物体识别过程中的特征点查全率.选取最适合高维数据的SVM非线性分类器,实现了特征描述符到视觉单词的转化以及待测物体的描述符归类过程,提高了语义特征表达的有效性,增加了物体识别效率. (3)基于小词库集的视觉物体分类方法 在物体分类中,视觉词汇包分类方法一般基于统一的大词库词典,典型的基于直方图的贝叶斯后验概率分类器.本文针对少数待识类别情况下的应用,提出了一种一类物体一个词库的分类方法,每一类词汇表明显小于统一大词库,系统稳健性明显提高.

展开

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值