旷世x北大 公开课 | 深度学习实战 笔记(1)

本文记录了从北大公开的深度学习实战课程中学到的内容,涵盖了人工智能的四大领域,重点解析了计算机视觉的定义、核心问题及历史,强调了深度学习在解决计算机视觉挑战中的作用,特别是卷积神经网络的发展。
摘要由CSDN通过智能技术生成

最近关注到一门28课时的《深度学习实战》的公开课(B站上有全集资源),觉着1-2天可以对深度学习有一个具体的了解,所以就开看了,这一篇是记录听课的学习笔记。


人工智能主要有以下四部分:

  • 语音(speech)
  • 视觉(vision)
  • 自然语言处理(NLP)
  • 通用人工智能(AGI):目前还做不了,包括resoning/ self-learning/interacting

其中语音和视觉是自然的光信号啊、声音信号啊,相对来说只要理解了其中的原理就可以做出来,也更容易推向市场;而NLP是人造出来的相对来说难一些,AGI输出了更抽象的概念和理解,所以目前还没办法做。

什么是计算机视觉:

  • 人类用眼睛和大脑感知世界
  • 计算机用摄像头/传感器感知世界

人脑的识别系统;

  • 大脑皮层,有6层,每层2毫米厚
  • 300亿个神经元(neurons),每个有几千个其他相连接。他们包含了我们所有的技艺,知识技能,生活经验。物理上是毫无二致的表面,没有明显的边界和分区。
  • 层级结构:视觉有V1,V2,V4,IT区,MT负责运动检测,A1的听觉区域,S1的初级体感。还有联合区域接受多个感官的输入。M1负责向脊髓传达指令驱动肌肉。

现在的科学家向从研究人脑的运作方式上来获得启发,以此来研究视觉的相关算法,但是目前来讲没有很大的进展。


计算机视觉终一些核心的问题:

  • 分类:对整张图片做分类,有没有电视机、猫狗、人之类的。
  • 检测:对照片终的人/物做检测。比较困难,比如计算机很难分出被大幅度遮挡的人/物。
  • 分割:对像素级别的分类,这个像素是属于哪个物体的。
  • 序列:把图片应用到视频上等等。
    在这里插入图片描述

计算机视觉的历史:

  • 1966年Marvin Minsky尝试用相机连在计算机上,然后让机器区描述它所看到的东西。但是这个难题至今也没有很好地被人解出来。
  • 1982年David Marr提出计算机视觉研究框架, 认为计算机视觉需要将照片描述分成三层:计算层描述、 算法层描述、 实现层描述。
  • Marvin Minsky认为David 的想法很好但是,如果解决不了核心的知识表示问题,那么即使去做边缘检测之类的也无法解决好计算机视觉的问题。
  • 所以关于知识表示问题,最直接的就是吧物体分割成块,然后分别识别。
  • 1989 卷积神经网络的应用,输入一张小的照片通过各种计算,最后输出图片文字等信息
  • 1998 人脸识别的应用
  • 90年代中期,神经网络因为没有更新的理论支持、没有训练数据、很难复现结果等一系列的原因,潮流褪去。
  • 2006年开始,深度学习开始复兴,因为又更快的学习算法的支持,比如分层计算、无监督的预训练、发现可以用GPU训练,以及语音和图像的一些突破性研究。
    • 关于图像深度的一些研究革命,最开始是AlexNet的8层(2010),到VGG的19层(2014),到GoogleNet的22层(2014),以及ResNet的152层。
    • 之前一般到20多层就下不去了,因为图片会有梯度消失的问题,硬要往下可能因为信号的衰减,就训练不起来了,而ResNet在几个连续层上加上了一条路径,残差学习有效地解决了这个问题,让没处的梯度足够大。
  • 2001年 Learning-based Representation
  • 2000-2011年左右 Feature-based Reprecentation 成为主流
  • 2010年 Deep Convolutional Neural Networks,一个比较大的突破。

深度神经网络的发展历史:
在这里插入图片描述

  • ImageNet 计算机视觉领域最大的数据集。
    在这里插入图片描述
  • 。。。。。。

课程推荐的阅读书籍:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值