计算机视觉的原理以及常见模型

风清扬加满

于 2024-03-22 19:26:24 发布

阅读量514

点赞数 3

文章标签：计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51798819/article/details/136950038

版权

典型的计算机视觉任务：

文生图

图像分类:构建分类器

1.传统的机器学习方法：特征提取+分类器

常见特征提取：颜色直方图，纹理特征，边缘检测等组合分类器（支持向量积，随机森林，k最近邻）对提取特征进行分类，实现图像分类

2.深度学习方法：卷积神经网络-经过多层卷积和池化操作，提取图像的局部特征和上下文信息。最后通过全连接层和softmax激活函数，将提取特征映射到不同类别并输出分类结果

常见算法：1.LeNe-5：最早，手写数字识别

2.AlexNet：里程碑，引入深度学习，使用多个卷积层和池化层

3.VGGNet：较深的网络结构和小尺寸卷积核，具有更好的特征提取能力

4.GoogleNet：引入Inception 模块，减少参数量

Inception：不同层需要捕捉不同的尺度信息，一些可能捕捉局部信息，使用较小卷积核，一些需要捕捉全局信息，使用较大卷积核，Inception 并行使用不同的卷积核核池化操作，允许网络在同一层内学习到不同尺度信息

1*1卷积降维：对通道上数据进行融合，

5.ResNet：残差学习思想，解决深层网络难以训练的问题

残差学习：网络过深后，理论上性能应该上身，但是因为梯度消失或者梯度爆炸问题以及增加的层数使得网络更难以训练，残差学习的思想帮助ResNet有效地解决这些问题

进行残差映射，传统直接学习目标映射H（x）,ResNet 中学习残差映射H（X）-x

定位：单个对象位置

目标检测：同时包含定位和分类

目标识别：找出图像中该对象的实例

实例分割：

目标追踪：连续视频帧作为输入

实例：人脸识别：

1.使用图像处理算法和模型，检测出人脸区域

2.人脸对齐：对检测到的人脸进行对其，以保证后续的特征提取和匹配的准确性

3.特征提取：通常使用深度学习模型来学习和提取有代表性的特征

4.特征匹配：将提取到的特征与已知人脸模板进行对比，计算相似度或者距离判断是否匹配

5.决策阈值

区分计算机视觉：

1.图像处理：处理原始图像以应用某种变换，其目标是改进图像或将其作为某项特定任务的输入，计算机视觉的目标是描述和解释图像

2.机器视觉：计算机视觉用于执行某些特定工作的特例，例如检测生产线上的容器是否干净

3.计算机视觉：解决更复杂问题，例如人脸识别，详细的图像分析（可帮助视觉搜索），或者生物识别方法

医疗行业：医疗图像分析，此类系统对MRI图像，CT扫描图像和X光图像进行分析，找出肿瘤等异常

挑战：图像和视频目标检测，这包括对不同数量的对象进行定位和分类

原理：

深度学习方法和技术深刻改变了计算机视觉领域

监督机器学习

1.利用CNN构建计算机视觉模型的通用方法：

1.创建一个包含标注图像的数据集或者使用现有的数据集，标注可以是图像类别，边界框和类别对，或者对图像中每个感兴趣的对象进行像素级分割

2.从每张图像种提取与待处理任务相关的特征，这是建模的重点，例如用来识别人脸的特征，基于人脸标准的特征与用来识别老板有经典或者人体器官的特征存在

3.基于特征训练深度学习模型，训练意为着向机器学习模型输入很多图像，然后模型基于特征学习如何解决问题

4.使用不同于所用数据的图像评估模型，测试训练模型的准确率

R-CNN

1.利用区域候选方法提取可能的对象

2.使用CNN识别每个区域中的特征

3.利用支持向量机对每个区域进行分类

典型特征提取难点：1.难以提取 ----解决：深度学习特征描述，CNN

2.计算的数据量巨大

风清扬加满

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

风清扬加满 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

96万+: 周排名

18万+: 总排名

4739: 访问

: 等级

220: 积分

9: 粉丝

19: 获赞

10: 评论

18: 收藏

私信

关注

热门文章

最新评论

pytorch框架的上手理解
CSDN-Ada助手: 恭喜您写下了第19篇博客《pytorch框架的上手理解》，看来您对这个主题已经有了相当深入的理解了！希望您能继续坚持创作，分享更多有价值的内容给大家。我建议您可以尝试写一些实战经验分享或者深入解析某个特定功能的教程，这样可以让读者更好地理解和运用pytorch框架。期待您的下一篇作品！祝您越来越好！
计算机视觉的原理以及常见模型
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
数据结构森林与二叉树转化的数量关系
CSDN-Ada助手: 恭喜你写完了第16篇博客！标题听起来很有趣，数据结构森林与二叉树转化的数量关系确实是一个有趣而复杂的话题。你的博客内容一定也非常精彩。在这个快速变化的技术世界中，持续创作并分享知识是非常重要的，你的努力值得赞赏！关于下一步的创作建议，我想提出一个谦虚的建议。在你的博客中，或许可以深入探讨一下数据结构森林与二叉树转化的实际应用场景，或者提供一些实例来帮助读者更好地理解这种数量关系。同时，你也可以考虑与读者互动，鼓励他们分享自己在这方面的经验和观点。再次恭喜你的努力和成就，并期待你未来更多精彩的创作！
csapp练习题7.3
CSDN-Ada助手: 恭喜您写了第17篇博客《csapp练习题7.3》！您的持续创作精神令人佩服，不断分享自己的学习心得对读者们来说是非常有价值的。希望您能继续保持这样的创作动力，继续分享您对CSAPP的练习题的思考和解答。在下一步的创作中，我建议您可以考虑增加一些实例或案例分析，这样读者能更直观地理解您的观点和思路。此外，您还可以尝试与其他读者互动，倾听他们的反馈和建议，这会使您的博客更加多元化和有趣。再次恭喜您，期待您的下一篇博客！
电路交换网络中，每条电路独占其经过的物理链路。
CSDN-Ada助手: 恭喜您写下了第18篇博客！标题“电路交换网络中，每条电路独占其经过的物理链路。”非常吸引人。您对电路交换网络的深入研究和理解令人钦佩。在您的博客中，您清晰地解释了电路交换网络中每条电路独占其经过的物理链路的原理和重要性。这对于理解电路交换网络的工作原理非常有帮助。希望您能继续保持创作的激情并分享更多关于电路交换网络的知识。对于下一步的创作建议，我谨慎地提出一个想法。或许您可以探讨一下电路交换网络的优缺点，并与其他类型的网络进行比较。这样一来，读者们将能够更全面地了解电路交换网络在不同场景下的适用性。请继续保持博客的高质量和深度，期待您未来的创作！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。