CV理论基础（一）：概述

最新推荐文章于 2024-07-12 09:53:23 发布

'仰望星空,脚踏实地'-菱

最新推荐文章于 2024-07-12 09:53:23 发布

阅读量1.2k

点赞数

分类专栏： CV理论基础文章标签：计算机视觉人工智能机器学习深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44365744/article/details/104549582

版权

计算机视觉是一门科学，旨在让机器模仿人类视觉，包括识别、跟踪和测量。它涉及图像预处理、特征提取、深度学习方法如CNN、RCNN、FCN，以及解决视角、光照等变化带来的挑战。学习路线涵盖图像处理、卷积、SIFT等特征描述子，以及深度学习前的图像分割技术。主要应用包括识别、分割、视觉语言和生成，常用开源库有Caffe、Pytorch、Tensorflow和Keras。

摘要由CSDN通过智能技术生成

计算机视觉理论基础（一）

是什么？
做什么？
与哪些学科有关？
研究什么？
怎么学？
- 学习路线
- 具体学习内容
- 主要研究问题
- - 识别分类
  - - CNN
    - RCNN
  - 分割
  - - FCN
    - 医学生物器官细胞
  - 视觉语言
  - - RNN
  - 生成
  - - GAN
- 开源库
- - Caffe
  - Pytorch
  - Tensorflow
  - Keras

计算机视觉

是什么？

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的，可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

做什么？

模拟人类视觉能力

识别人、物体、场景
估计立体空间、距离
躲避障碍物进行导航
想象并描述
理解图片

弥补人类视觉缺陷

忽略细节
受幻觉干扰
描述主观
无法长期稳定执行统一任务

与哪些学科有关？

在这里插入图片描述

研究什么？

研究理论和应用

在这里插入图片描述

<

最低0.47元/天解锁文章

'仰望星空,脚踏实地'-菱

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。