CV理论基础(一):概述

计算机视觉是一门科学,旨在让机器模仿人类视觉,包括识别、跟踪和测量。它涉及图像预处理、特征提取、深度学习方法如CNN、RCNN、FCN,以及解决视角、光照等变化带来的挑战。学习路线涵盖图像处理、卷积、SIFT等特征描述子,以及深度学习前的图像分割技术。主要应用包括识别、分割、视觉语言和生成,常用开源库有Caffe、Pytorch、Tensorflow和Keras。
摘要由CSDN通过智能技术生成


计算机视觉

是什么?

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

做什么?

模拟人类视觉能力

  • 识别人、物体、场景
  • 估计立体空间、距离
  • 躲避障碍物进行导航
  • 想象并描述
  • 理解图片

弥补人类视觉缺陷

  • 忽略细节
  • 受幻觉干扰
  • 描述主观
  • 无法长期稳定执行统一任务

与哪些学科有关?

在这里插入图片描述

研究什么?

研究理论和应用

在这里插入图片描述

<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值