bottom-up attention features代码的一些笔记

最新推荐文章于 2024-02-16 14:52:04 发布

jack_ya_ng

最新推荐文章于 2024-02-16 14:52:04 发布

阅读量3k

点赞数 5

文章标签： image captioning bottom-up attention

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangshaokangrushi/article/details/103319494

版权

mscoco 数据集的bottom-up attention的特征（目标检测的框对应的特征)
trainval_resnet101_faster_rcnn_genome_36.tsv 或者 trainval_resnet101_faster_rcnn_genmoe.tsv

下载地址为 https://github.com/peteanderson80/bottom-up-attention#demo
在这里插入图片描述
.tsv文件中数据格式如下

FIELDNAMES = ['image_id', 'image_w','image_h','num_boxes', 'boxes', 'features']

其中item['boxes']为对应检测框的位置信息 x,y,w,h
item[''boxes'].shape=(num_boxes,4)

item['features']为对应检测框 在pool5_flat 层的特征
item['features'].shape=(num_boxes, feature_dim)

item['num_boxes'] 为该张图片对应的检测框数目

注意到源码中写到
 return {
        'image_id': image_id,
        'image_h': np.size(im, 0),
        'image_w': np.size(im, 1),
        'num_boxes' : len(keep_boxes),
        'boxes': base64.b64encode(cls_boxes[keep_boxes]),
        'features': base64.b64encode(pool5[keep_boxes])
    }   
   所以在读取 .tsv文件是，需要用到base64.decodestring()解码

可以参考 https://github.com/peteanderson80/bottom-up-attention/blob/master/tools/generate_tsv.py获取这些信息的详细由来过程

感谢苏璐岩小姐姐

关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
10
评论
bottom-up attention features代码的一些笔记

mscoco 数据集的bottom-up attention的特征（目标检测的框对应的特征)trainval_resnet101_faster_rcnn_genome_36.tsv 或者 trainval_resnet101_faster_rcnn_genmoe.tsv下载地址为 https://github.com/peteanderson80/bottom-up-attention#dem...
复制链接

扫一扫

jack_ya_ng CSDN认证博客专家 CSDN认证企业博客

码龄9年

18: 原创

15万+: 周排名

160万+: 总排名

4万+: 访问

: 等级

639: 积分

11: 粉丝

28: 获赞

52: 评论

90: 收藏

私信

关注

热门文章

分类专栏

最新评论

video bert & visual bert
CSDN-Ada助手: 非常感谢CSDN博主分享关于video bert和visual bert的文章，这两个技术在视频处理和图像处理方面都有很好的应用。我觉得下一篇博客可以继续深入探究图像处理方面的技术，比如基于CNN的图像分类方法，以及最新的GAN图像生成技术。这样的技术文章对其他用户学习图像处理和计算机视觉都会有很大的帮助。相信会有更多读者受益于这样的深入分析和探究。期待您的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
COCO image caption数据集格式
diaiaLi: 你好，想请教下annotation中关于caption的'id'的生成，一张图片5个caption是同张图片的5个caption需要5个id吗，最近卡在这里导致生成的词的数量不对
COCO image caption数据集格式
iiitachi258: 同求看了很多都没有关于这个方面的
bottom-up attention features代码的一些笔记
moon4869: 你好，item['boxes']为对应检测框的位置信息，具体的值好像是左上角和右下角的坐标？而不是左上角坐标和box的宽高？
pytorch DataParallel理解及易犯错误（逻辑上感觉没问题，但是返回时候却出错）
zhaoliang照亮你: 你好，请问可以交流一下这个问题嘛

最新文章

目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。