自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 2021-09-26

将文件夹中同名的.jpg和.txt文件分开 #将图片与打标文件分开 import time import os import shutil def readFilename(path, allfile): filelist = os.listdir(path) for filename in filelist: filepath = os.path.join(path, filename) if os.path.isdir(filepath):

2021-09-26 13:22:10 95

原创 2021-09-20

论文笔记《Meshed-Memory Transformer for Image Captioning》 该论文改变原始编解码中transfomer的结构,原始的attention结构将每个输入与所有输入进行加权和得到输出。如果输入是一个句子的所有单词的嵌入向量,那么输出是加了不同权重后的单词向量。如果编码器用transfomer来对图像区域进行编码,输入是一个图像区域的特征,输出是在这个区域内加了注意力后的区域特征。对于一幅图像会有多个区域特征,transfomer的局限在于不同区域特征间的先验关系无法得

2021-09-20 17:51:32 234

原创 2021-07-30

Image Caption知识整理 论文:nocaps: novel object captioning at scale Nocaps:400 novel objects 这部分在笔记本上 论文:VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning(CVPR,2021.3.4) 两阶段: 预训练阶段:模型学习用标签去打标图像区域用图像-标签对作为训练数据 微调阶段:给检测到的图像描述对及其相应的对象标签,模型学习将图像映射到句子

2021-07-30 13:56:46 273

原创 2021-07-30

《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering》论文笔记 GitHub链接: https://github.com//peteanderson80/bottom-up-attention 本文提出一种自上而下与自下而上相结合的注意力模型方法,应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型(使用Faster R-CNN)用于提取图像中的兴趣区域,获取对象特征;而基于

2021-07-30 13:48:57 120

原创 2021-06-02

工件匹配MFC框架搭建 创建基于对话框的MFC项目: 对话框界面: 打开文件 按钮ID是button1负责选择要匹配的图,并显示在下方的picture control控件中。主要代码(直接双击按钮就可以在里面写代码): void CMFCApplicationDlg::OnBnClickedButton1() { // TODO: 在此添加控件通知处理程序代码 //读入待检测图像 CFileDialog dlg( TRUE, _T("*.bmp"), NULL, OFN_FILEMUSTE

2021-06-02 22:33:20 195

原创 linux常用指令记录

linux 常用指令记录 nvidia-smi 看哪个卡有内存 conda creata -n +虚拟环境名 +python=x.x 创建python版本为x.x的虚拟环境 conda env list 查看有哪些环境 source activate +环境名

2021-03-24 17:22:49 83 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除