cs231n——1introduction

计算机视觉是一门跨学科的领域,比如工程、物理、生物、心理学、计算机科学以及数学。

简史

  • 视觉是进化大爆发的驱动力
  • 生物的大脑是如何处理视觉信息的
    • 基础视觉皮质层:列排列,每一列处理简单的形状
    • 视觉处理的第一步是简单的形状结构处理、边缘、排列
  • David Marr
    • 视觉是分层的。
    • 视觉架构:边缘模型->2.5D->3D
  • 模型
    • Generalized Cylinder:世界是简单物体的组合
    • Pictorial Structure:简单组合+弹簧连接
      *成就
    • 感知分组
    • 人脸检测
    • 特征学习
    • 场景识别
  • 基准测试
    • Pascal visual object challenge
    • imagenet
  • 两大基础
    • 边缘处理
    • 视觉分层

课程主要内容

  • 识别和分类
    • object detection
    • action classification
    • image captioning
  • CNN
    • Kunihiko Fukushima 提出了模型 Neocognition
    • Yann Lecun 反向求导、学习策略、手写识别

待解决的问题

  • 视觉智能远远大于物体识别
  • 对整个照片进行密集标记、感知分组
  • 将识别和3d整合起来
  • 动作和场景
  • 探究物体之间的关联(visual genome)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值