初识计算机视觉

首先介绍了计算机视觉的相关领域,因为它不仅仅关乎计算机科学,还涉及生物,物理,工程等等学科,是一门综合性很强的学科。

接着从物种大爆炸讲起

推测生物有了视觉后极大地扩张了活动区域,带来了生物的蓬勃发展。

接着讲计算机视觉在近现代的发展,这里省略,直接跳到近些年有重要意义的学术成果。

2001年Viola&Jones推出人脸识别算法haar检测器

1999年David Lowe推出sift特征算法

2005年和2009年分别出现HOG特征算法和DPM算法

除了算法上的改进,数据规模的增大也是推动计算机视觉发展的主因,甚至到了深度学习时代,是各种数据集推动着算法的演化。

以下分别是PASCAL VOC和ImageNet,PASCAL 包含20类物体,而ImageNet则有惊人的22000类物体,图片数量达到1千4百万张。

那么计算机视觉究竟要解决哪些问题,比较重要的几个问题包括图像分类,

目标识别,图像描述,图像分割,场景理解等,其中,场景理解可以说是终极目标,

自然也是最具挑战性的问题。

回到这门课本身,CNN对于计算机视觉有何帮助,可以说进入人工智能时代,CNN就是解决计算机视觉的全部。不过CNN的出现可是有些年头了,早在1998年,Lecun就成功地利用CNN来识别邮政数字了,不过直到2012年Alexnet的出现引发了这一潮流。下面左图就是二者的网络结构,可以看出并没有大的改变,所以不得不归功于今时今日计算机的性能和数据集的出现。右图是在ImageNet数据集上的历年冠军,从2012年往后,基本就是CNN的天下了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值