计算机视觉从入门到精通,计算机视觉入门(示例代码)

第一节课: 计算机视觉整体概述

这学期正在上一节计算机视觉课程,有些不懂的知识上百度搜索发现关于计算机视觉的文章寥寥无几。 这节课主要讲解的是计算机视觉里面的图片识别,不会讲到识别一些正在运动的物体。

希望可以把自己学到的东西分享给大家。因为版权等问题,我无法将lecture notes放在这里,但是我会把自己所理解的东西写下来。

1. 什么是计算机视觉(Computer Vision)?

老师给出的定义:  Enable machines to “see” the visual world as we do. (可以让机器像我们一样看见并且识别东西). 个人理解计算机视觉也就是我们平常说的人脸识别,车牌号识别,自动驾驶里面的树,人各种交通符号的识别,以及各种人们想要识别的东西都可以通过算法来识别出来。另外计算机视觉是人工智能(AI)的一个分支。

计算机视觉包含三点:

1. Measurement(测量): 通过visual data计算这个3D世界的不同属性。

2. Perception&interception(认知和翻译): 通过使用一些算法和representation(讲解)可以使机器认知一些物体,人,景色以及运动的东西。

3. Search&organization(搜索和整理): 通过一些算法来和visual data 挖掘,搜索和交互。

下图就是典型的计算机视觉技术分析出来一个公园里面的各种信息:

aff01d33c215e44aa355c73f068ca3e9.png

下图为计算机视觉以及其相关的科目:

5bc2a5ef1e38518240916909cc745a77.png

下图为图片和模型之间的关系,应该很清楚的表示了从图片到模型属于视觉,反之则为图像:

e96a44d8d14c573f405fec5386b50703.png

2. 为什么计算机视觉很难实现?

提到几点:

1. 真是的世界比我们看到的图片中的要复杂得多(从3D世界到2D图片)。

2. 从图片还原出来当时的过程(process)是不可能的.

3. 物体的运动(比如奔跑中的人照片可能是模糊的).

4. 物体多元化,比如椅子可以有很多种很多不同颜色不同品牌等等...

5. 光源,物体的动作,背景杂乱的影响等等都会影响。见下图

b5fd81ef86eaba0ebfab4e8cb7ab98f5.png

3. 现在的科学技术已经做到了哪些?

1. 图片分类(Image classification),下图

121a929bfbbbd2ca1c24d0d9d13c583d.png

2. 人脸识别(Face detection), 这个很好理解就不放图了

3. 物体识别(Object classification),下图

97f9027905f66a044b867cc9d9474ef4.png

4. 脸部匿名化(face anonymization),其实就是变脸...

5. 交互式系统(比如xbox的kinect)

6. 自动驾驶中的人,树,和其他一些交通指示牌。

7. 动作的捕捉(motion capture),见下图

a781c4b32dd80c71875930e4a0d3ed24.png

8. 还有很多不一一列举了...

4. 计算机视觉的运用(Applications)

机器人学,自动驾驶,图片搜索,医学领域图片等等,平时用的美图秀秀和那个什么把人脸变成狗脸的faceu都是计算机视觉领域。

5. 总结

总之计算机视觉是一个新兴的领域,非常有用,有趣但是很难。。。 这堂课我们会讲解图片构成,原理,如何变化以及如何识别。 运用的语言是Matlab(上这节课之前我是一点都不会matlab[哭~])。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值