计算机视觉与深度学习-前言

以下内容是自己学习北京邮电大学鲁鹏教授计算机视觉与深度学习课程(A02)的一些笔记,笔者能力有限,如有错误还望各位大佬在评论区批评指正 。

先贴一下课程的官网:CV-XUEBA

1、什么是计算机视觉?

计算机视觉(computer vision)是一门研究如何使机器“看”的科学,也就是通过摄像头的捕获,再经过计算机处理,输出解释。计算机视觉最重要的是摄像头对采集图像的理解。

2、计算机视觉的目标(难点)

如下图,人能很快的看出图中有火车,楼梯,而且火车是倾倒的,从图中信息可以得出这显然是一场灾难。但是在机器看来这是一些数据矩阵,既然我们要让机器像人一样能够理解图像,我们就要让机器能看到图像中的组成元素,从而理解图像要表达的含义。也就是说,计算机视觉的目标是跨越“语义鸿沟”建立像素到语义的映射。

例如一张300*400的灰度图,每个像素点都是0-255的数字所代表的色阶,对机器来说是12000个像素点,如果每个像素点用1byte表示就是12000byte,机器需要从这12000个byte中像人类一样理解这张图所表达的含义。这就是从byte到图像语义,计算机视觉的难点就在这。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值