基于模板--Baby Talk: Understanding and Generating Simple Image Descriptions


论文名称:Baby Talk: Understanding and Generating Simple Image Descriptions
论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6522402
2013年 TPAMI


这篇论文主要介绍的就是基于模板的caption生成方法。而且也是经典文章之一。


  • 检测对象属性和介词,并通过CRF共同推理出一个合适的单词填入槽中
  • baby talk 所需要的信息总的来说需要三部分的信息:
    1)object信息(名词)
    2)object的相对位置关系(介词)
    3)object的附加信息的修饰词(形容词)

使用baby talk的方法生成caption语句的效果图

整体结构图

  • 1、object & stuff 检测器检测出候选对象,object:图像的对象检测器,stuff:图像的背景检测器
  • 2、每个候选区域由一组属性分类器处理
  • 3、两个候选对象之间的关系(由介词关系函数处理)
  • 4、CRF是构造包含由1)-3)计算的一元图像电势,以及从大文档语料库计算的基于高阶文本的电势
    (CRF[条件随机场]推断对象属性和介词,得到一个合适的单词,填入槽中)
  • 5、预测图形的标记,语言模型预测连接词(there, is)
  • 6、基于标记生成句子
    句子生成用m-gran或者基于简单模板的方法

CRF结构图

  • CRF引入Z变量减少成对电势 【CRF预测图像的最佳标记】
  • CRF节点:①对象或者stuff(背景信息)
    ②修饰对象的属性
    ③引入对象对之间空间关系的介词
  • 大多数CRF只接受一元成对电势 -->三元电位引入一个Z节点,变成a set of 一元成对电势
  • Template 和simple Decoding 结果对比图

CRF函数的计算公式

Templated 和简单decoding的结果对比

  • 好的结果图
  • 坏的结果图

为什么说是坏的结果图?
因为生成的caption语句中所检测的对象类别是错的。

生成句子错误的三个原因:

1、错误的对象检测器,导致丢失对象
2、检测出错误类别的对象检测器
3、错误的属性预测器

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
2023-07-14T05:18:42.813472Z 0 [System] [MY-010116] [Server] /usr/sbin/mysqld (mysqld 8.0.33) starting as process 30413 2023-07-14T05:18:42.827066Z 0 [Warning] [MY-010075] [Server] No existing UUID has been found, so we assume that this is the first time that this server has been started. Generating a new UUID: e64114ff-2205-11ee-870e-080027f67bef. 2023-07-14T05:18:42.831208Z 1 [System] [MY-011012] [Server] Starting upgrade of data directory. 2023-07-14T05:18:42.831274Z 1 [System] [MY-013576] [InnoDB] InnoDB initialization has started. 2023-07-14T05:18:43.035632Z 1 [ERROR] [MY-013090] [InnoDB] Unsupported redo log format (v0). The redo log was created before MySQL 5.7.9 2023-07-14T05:18:43.035675Z 1 [ERROR] [MY-012930] [InnoDB] Plugin initialization aborted with error Generic error. 2023-07-14T05:18:43.468804Z 1 [ERROR] [MY-011013] [Server] Failed to initialize DD Storage Engine. 2023-07-14T05:18:43.469038Z 0 [ERROR] [MY-010020] [Server] Data Dictionary initialization failed. 2023-07-14T05:18:43.469053Z 0 [ERROR] [MY-010119] [Server] Aborting 2023-07-14T05:18:43.469908Z 0 [System] [MY-010910] [Server] /usr/sbin/mysqld: Shutdown complete (mysqld 8.0.33) MySQL Community Server - GPL. 2023-07-14T05:25:59.141609Z 0 [System] [MY-010116] [Server] /usr/sbin/mysqld (mysqld 8.0.33) starting as process 6178 2023-07-14T05:25:59.156401Z 1 [System] [MY-011012] [Server] Starting upgrade of data directory. 2023-07-14T05:25:59.156446Z 1 [System] [MY-013576] [InnoDB] InnoDB initialization has started. 2023-07-14T05:25:59.356548Z 1 [ERROR] [MY-013090] [InnoDB] Unsupported redo log format (v0). The redo log was created before MySQL 5.7.9 2023-07-14T05:25:59.356610Z 1 [ERROR] [MY-012930] [InnoDB] Plugin initialization aborted with error Generic error. 2023-07-14T05:25:59.793224Z 1 [ERROR] [MY-011013] [Server] Failed to initialize DD Storage Engine. 2023-07-14T05:25:59.793509Z 0 [ERROR] [MY-010020] [Server] Data Dictionary initialization failed. 2023-07-14T05:25:59.793525Z 0 [ERROR] [MY-010119] [Server] Aborting @
07-15

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值