跟着鲁sir学CV_Opencv（8）识别、词袋

Joy ˇ

于 2024-05-23 09:34:15 发布

阅读量361

点赞数 4

分类专栏： opencv 文章标签： opencv 人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_59143106/article/details/139126413

版权

opencv 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

识别分为单实例和类别识别，前者特殊性，后者有普遍性。

算法包括：对图和视频的分类，检测定位物品，估计语义和几何属性，分类人类活动与事件

深度学习解决“形变”，局部特征可以帮助解决“遮挡”，还有些问题，“背景”

图像识别系统包括：表达（表达，分类）——学习（学习分类器，给训练数据集）——识别（分类器运用在新数据中）

表达

整图表达成小区域、考虑区域联系→词袋

达到：invariance——图像变化（光照、遮挡、尺度）后提取特征仍然是同一个；covariance——图像变化后提取特征“经过转换”仍然是同一个

产生式：画出张三（圈起来），p(a,b)——似然、先验 p(b|a)p(a)

算法：朴素贝叶斯、LDA、2d part based models、3d part based models

判别式：知道张三李四差异，区分开（线分开）p(b|a)——后验

算法：近邻、神经网络、支持向量机、boosting

混合式

图像变成向量——BoW词袋模型

最早起源于纹理

用直方图判别每张图各种纹理出现的次数

把图变成袋子里的小块，词典写向量（长度单词个数）

提取特征——学习视觉词典——用词典频率表示图像

提取特征

网格、SIFT提取（归一化、描述符）

视觉词典 codebook

将单词聚类，想要几个聚成几个，每个取中心

kmeans聚类

之后将图向量化后投影到空间中，看距离哪个单词中心最近

近邻、KD树搜索

下图左边为中心单词

问题：对聚类类别的设置（太大、太小，影响泛化）、计算效率（kmeans慢）

词典成型

但是词袋模型存在对特征顺序不一样的无法判断准确，如我爱AB，和爱我AB，其实是不太一样，特别是涉及语义理解、我们可以将整图分成多个区域，每个区域去对应比较

学习

最优化：在训练集和验证集上找目标函数的最优参数

监督级别：标签强弱

样本：能拿到多少

先验定义

过拟合（精度太过了）、欠拟合（需要泛化强，不能欠）

“非”类数据的收集——选不好，线条分不准

识别

给我图——做分类、检测（画框挑出，框中是不是）x,y,S,θ,N类、分割（像素级别）

对同一个对象输出太多框——要非最大值抑制

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
跟着鲁sir学CV_Opencv（8）识别、词袋

识别分为单实例和类别识别，前者特殊性，后者有普遍性。算法包括：对图和视频的分类，检测定位物品，估计语义和几何属性，分类人类活动与事件深度学习解决“形变”，局部特征可以帮助解决“遮挡”，还有些问题，“背景”图像识别系统包括：表达（表达，分类）——学习（学习分类器，给训练数据集）——识别（分类器运用在新数据中）
复制链接

扫一扫

专栏目录

Joy ˇ CSDN认证博客专家 CSDN认证企业博客

码龄3年

72: 原创

74万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

1000: 积分

223: 粉丝

273: 获赞

5: 评论

219: 收藏

私信

关注

热门文章

分类专栏

最新评论

【数据结构】手写快速排序
泡芙萝莉酱: 博主的文笔非常优秀，通过这篇关于“【数据结构】手写快速排序”的博文，我对这个主题的理解有了翻天覆地的变化。博主不仅仔细地介绍了快速排序的原理和实现方法，还用清晰的细节展示了其中的关键步骤，让我受益匪浅。博主的文章让我深刻感受到其扎实的学术功底和独特的见解，让我十分期待能够在未来看到更多博主的精彩分享。希望博主能够继续保持创作的热情，为读者带来更多有价值的内容，同时也愿意在学习中得到博主的指导和支持，共同进步。衷心感谢博主的辛勤付出和专业分享！
mysql＞ show database；ERROR 1064 (42000): You have an error in your SQL syntax； check the manual tha
gekunyuan: 太感谢了这你到底是怎么解决的这个问题真的太离谱了我怎么没早点看到你的贴子浪费好几个小时
跟着鲁sir学CV_Opencv（10）卡尔曼滤波
CSDN-Ada助手: 不知道 OpenCV 技能树是否可以帮到你：https://edu.csdn.net/skill/opencv?utm_source=AI_act_opencv
QMediaPlayer file not found
m0_62434591: 不行 qmake了以后也还是不行

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。