第七讲_图像描述(图说)Image Captioning

第七讲_图像描述(图说)Image Captioning

  • 本章结构
    hPDPYkb.png
  • 递归神经网络
    FkcEB8H.png

  • 时序后向传播(BPTT)
    ySa3BWd.png

朴素Vanilla-RNN

  • 基本模型
  • 用sigmoid存在严重的梯度消失
    vPqQ1CZ.png

LSTM长短时记忆模型(97年提出)

  • 基本模型
    dF7xArG.png
  • 模型对比
    vNwn6z7.png
  • LSTM数学模型
    21W6b3d.png
  • 控制门作用理解
  • LSTM结构图
    TA1lRzN.png
    xotpRqr.png
    lxkwpIb.png
    kH6joNr.png
    GyVWr0Y.png
    lMkbj9v.png
    080maoq.png

  • LSTM变种:
  • Peephole
  • Coupled 忘记输入门

GRU门限递归单元(Gated Recurrent Unit)

  • 改进
    7xVN07y.png
  • LSTM和GRU比较
    EMZANfb.png

图像描述

  • 为图片生成描述语言
    1nXOA84.png

  • 具有多模态理解和推理;复合理解与推理等研究难点和挑战
    LGQ7Psm.png
  • 传统的分段处理策略
    Hb4W5Ke.png
  • 新的点对点策略
    C2SQdLw.png
  • 模型组成
    9jXMpgG.png

Show and tell 模型

  • 概述
    xqlk5U8.png
    eIHkgHk.png

  • 具有attention机制模型
    I6hYXMy.png
    jtipXQG.png

数据集

  • MSCOCO标注集
    Xw0CvFK.png
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值