初窥图像识别与k-means算法

最新推荐文章于 2022-06-28 18:26:22 发布

VIP文章 X. Zhou

最新推荐文章于 2022-06-28 18:26:22 发布

阅读量263

点赞数

分类专栏：机器学习文章标签：算法聚类 python 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/real_cactus/article/details/110621469

版权

　　前段时间做了一个车型识别的小项目，思路是利用k-means算法以及词袋模型来做的。

　　近年来图像识别的方法非常非常多，这边只记录一下我那个项目的思路，核心思想是k-means算法和词汇树。

　　很遗憾没有做详尽的开发前的思路文档，只能按照记忆进行大致总结。

　　项目分为三大模块：特征点抽取、训练词汇树、识别(利用训练好的词汇树)。

　　首先是特征点的抽取。我是用的OpenCV的框架来做的特征点抽取。这里提到两种特征点：SURF和SIFT。

　　关于这两种特征点提取算法，这里做简要介绍(其实我真的不太care，主要是看哪个的特性适合我的项目。单纯为了实现这个东西的话我觉得没必要太深究这个，当然如果你要把这个东西做透了，那肯定得好好研究，毕竟源码来看还是有很多可以优化的东西)。

　　SIFT特征是图像的局部特征，对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有良好的不变性，对视觉变化、仿射变换也保持一定程度的稳定性。SIFT算法时间复杂度的瓶颈在于描述子的建立和匹配，如何优化对特征点的描述方法是提升SIFT效率的关键。

　　SURF算法的优点是速度远快于SIFT且稳定性好;在时间上，SURF运行速度大约为SIFT的3倍；在质量上，SURF的鲁棒性很好，特征点识别率较SIFT高，在视角、光照、尺度变化等情形下，大体上都优于SIFT。

　　这里要提到的一点就是SURF是64维的特征描述子，而SIFT是128维的特征描述子，简单点数说就是SIFT是X=(x1,x2,x3,...,x128)。而SURF是Y=(y1,y2,y3,...,y64)。从做k-means聚类的角度上来说我果断选择了SURF算法来提取(不过因为用的是OpenCV框

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
初窥图像识别与k-means算法

　　前段时间做了一个车型识别的小项目，思路是利用k-means算法以及词袋模型来做的。　　近年来图像识别的方法非常非常多，这边只记录一下我那个项目的思路，核心思想是k-means算法和词汇树。　　很遗憾没有做详尽的开发前的思路文档，只能按照记忆进行大致总结。　　项目分为三大模块：特征点抽取、训练词汇树、识别(利用训练好的词汇树)。　　首先是特征点的抽取。我是用的OpenCV的框架...
复制链接

扫一扫

专栏目录

X. Zhou CSDN认证博客专家 CSDN认证企业博客

码龄3年

41: 原创

54万+: 周排名

49万+: 总排名

2万+: 访问

: 等级

494: 积分

12: 粉丝

17: 获赞

10: 评论

80: 收藏

私信

关注

热门文章

分类专栏

最新评论

Transformer解析与tensorflow代码解读
weixin_40552976: attention = tf.transpose(outputs, [0, 2, 1]) tf.summary.image("attention", tf.expand_dims(attention[:1], -1)) 用来干啥的？？为啥要transpose一下？？本来是(N,TQ,Tk)现在到(N,Tk,TQ) 这里对output做transpose，得到的attention可能只是为了给tf.summary.image使用，tf.summary.image是一个图片展示工具，猜测是展示attention的权重。这个attention只用在此处，并没有流入下游，下游使用的仍然是output！！！
使用BERT预训练模型+微调进行文本分类
RabbitKong: 请问用的什么数据啊
基于docker的python faster-rcnn caffe环境搭建+提取目标特征实验
_RAN-v: 请问作者有resnet101_faster_rcnn_final.caffe这个模型吗？源代码里的链接失效了
使用BERT模型生成句子序列向量
气象少年: 你好博主你能写一份pytorch版本的吗？邮箱[email protected]
基于docker的python faster-rcnn caffe环境搭建+提取目标特征实验
weixin_41584101: 按照作者的方法成功编译了，请问作者有保存预训练模型吗？可以分享一下吗！不胜感激

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。