第八讲_图像问答Image Question Answering

第八讲_图像问答Image Question Answering

  • 课程结构
    Gk4r6EN.png
  • 图像问答的描述
    s9cina3.png
  • 具备一系列AI能力:细分识别,物体检测,动作识别,常识推理,知识库推理.....
  • 先要根据问题,判断什么任务
  • 图像问题与图像描述的关系
    nUbvF9a.png
  • 研究的难点和挑战
    7g45tBt.png
  • 研究方向
    CoRElTo.png

数据集

  • COCO-QA来源MSCOCO
  • VQA(visual question answering)
  • 平衡数据集V1.9-->V2.0
  • Visual7W---Visual Genome的子集

图像问答模型

  • 模型
    HeQa9m2.png
  • 基本都是VGG-Net和ResNet,LSTM模型
  • LSTM:三个门和记忆状态
    jGaiPMX.png
  • 基本模型
    avcqVZ4.png
    o01ISLd.png

模型增强:注意机制

  • 基本模型
    Ba953EM.png
    kQpuEeH.png

模型增强:外部知识库

  • 基本模型
    0o6oEWd.png
  • 属性预测模型
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值