计算机视觉(一)

计算机视觉CV的入门理解

最近开始,工作中需要使用计算机视觉CV,而博主之前没有系统学习过,因此把学习的知识记录下来,作为入门理解。

如果想要机器能够进行思考,我们需要先教会它们去看。 ——斯坦福人工智能实验室和视觉实验室主任-李飞飞

在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。

用于自动驾驶的图像分割:

用于自动驾驶的图像分割


1. 计算机视觉cv

1.1 基本概念

计算机视觉(Computer vision):是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。

1.2 主要技术点

计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割。

1.3 应用场景

以下给出关于CV技术的使用场景:

(来自商汤):
在这里插入图片描述
(来自百度):
在这里插入图片描述

1.4 实际应用:

近几年随着人脸识别在生活中的应用场景不断增加,计算机视觉开始渐渐走入大众视野,近年来的一些实际的使用中:

  • 人脸识别: Snapchat 和 Facebook 使用人脸检测算法来识别人脸。

  • 图像检索:Google Images 使用基于内容的查询来搜索相关图片,算法分析查询图像中的内容并根据最佳匹配内容返回结果。

  • 游戏和控制:使用立体视觉较为成功的游戏应用产品是:微软 Kinect。

  • 监测:用于监测可疑行为的监视摄像头遍布于各大公共场所中。

  • 生物识别技术:指纹、虹膜和人脸匹配仍然是生物识别领域的一些常用方法。

  • 智能汽车:计算机视觉仍然是检测交通标志、灯光和其他视觉特征的主要信息来源。

除了上面这些看起来高大上的技术,其实在现实生活中,我们都有过接触类似的。比如美图秀秀里的美妆,就用到了人脸检测、人脸关键点定位的技术。百度识花,用到了通用物品识别的技术等等。

1.5 专业工具

工欲善其事,必先利其器。

OpenCV(开源计算机视觉库)是一个非常强大的学习资料库,包括了计算机视觉,模式识别,图像处理等许多基本算法。它免费提供给学术和商业用途,有C++,C,Python和java接口,支持Windows、Linux、Mac OS、iOS和Android。

在编程语言方面,我主要使用Python,计算机视觉离开计算机编程是完全行不通的。

基础技能,需要学会一些数字图像处理,它是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。


参考文献:
图片:https://www.jianshu.com/p/91de7a37d8e1
慕课:https://www.imooc.com/article/27970
李飞飞计算机视觉系列视频:https://study.163.com/course/introduction.htm?courseId=1003223001#/courseDetail?tab=1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值