image caption
binqiang2wang
这个作者很懒,什么都没留下…
展开
-
Positional encodings
这个概念最早出自论文《Convolutional Sequence to Sequence Learning》因为是用卷积来做,作者为了捕捉时序关系,提出了给不同位置做一个编码,原文中是这样说的:原文当中的说法也就是一个position embedding。具体改怎么操作呢?官方给出的代码里面是有些的,分为两种,一种是可学习的,一种是三角函数的,后来三角函数用的多,这里用三角函数来说明:...原创 2020-01-14 20:49:50 · 900 阅读 · 0 评论 -
cvpr 2019 image caption
2019cvpr image captioning的论文总共16篇左右,其中主要包括三个方向:第一:就是评价指标;第二:就是提出新任务,一般都附带一个新的数据库;第三:就是发现原先captioning当中的的问题,提出一定的解决方案。通过整体阅读,会发现,最后一种当中精度提升都一般,只要选择合适的比较算法,然后讲好自己的故事,就是很优秀的work。下面,我们来简单整体看一下相关论文。第一类...原创 2019-06-30 15:42:03 · 6070 阅读 · 6 评论 -
imae caption coco json2txt
json文件虽然也可以直接使用notepad++打开,但是coco image caption的数据库还是有点大,打开的时候电脑一直卡死,为了更好的直接打开,还是想要转化成txt。首先是要知道json内部的结构,我这里使用pycharm的debug模式来看数据结构:这里真正用到的就是images和annotations两部分,详细看一下这两个部分:images这里用到的其实就只有两部分,一...原创 2019-07-17 17:05:25 · 391 阅读 · 2 评论