自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(79)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 用于视觉问答的防御网格特征模型《In Defense of Grid Features for Visual Question Answering》

这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收获。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Popularized as ‘bottom-up’ attention [2], bounding box (or region) based visual features have recently surpassed vanilla grid-based convolutional features as the de facto standard for vision a

2020-06-21 17:32:06 1857 3

原创 用于视觉问答的深度模块化共同注意网络 《Deep Modular Co-Attention Networks for Visual Question Answering》

Visual Question Answering (VQA) requires a finegrained and simultaneous understanding of both the visual content of images and the textual content of questions. Therefore, designing an effective ‘co-attention’ model to associate key words in questions with

2019-10-21 12:33:49 6074 6

原创 CSS-VQA 的自我理解

我们依次介绍V-CSS的的所有步骤,该步骤包括四个主要步骤:初始对象选择(IO_SEL),对象局部贡献计算,关键对象选择(CO_SEL) ,以及动态答案分配(DA_ASS)。1. Initial Objects Selection (IO_SEL). 通常,对于任何特定的QA对,图像中只有几个对象是相关的。 为了缩小关键对象的选择范围,首先构造一个较小的对象集,并假定中的所有对象对于回答这个问题可能都是重要的,由于缺少每个样本的关键对象的注释,因此遵循[39]来提取与质量保证高度相关的对象。...

2020-09-15 13:37:12 518 3

原创 使用pip下载过慢----试试清华镜像

pip 用清华镜像解决下载速度过慢问题pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba这里我下载分词库 jieba

2020-06-05 15:01:59 501 1

原创 深度学习500问阅读笔记——理解One Hot Encodeing原理及作用?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。11.理解One Hot Encodeing原理及作用?问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑以下的三个特征:["male","female"]["from Europe","from US","from Asia"]["use Firefox","uses Chrome","uses Safari","uses Internet Explorer"]如

2020-05-18 08:08:59 366

原创 深度学习500问阅读笔记——Batch_Size

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。10.Batch_Size1.为什么需要Batch_Size?Batch的选择,首先决定的是下降的方向。如果数据集比较小,可采用全数据集的形式,好处是:(1)由全数据集确定的方向能够更好地代表样本的总体,从而更准确地朝向极值所在的方向。(2)由于不同权重的梯度值差别巨大,因此选取一个全局的学习率很困难。Full Batch Learning 可以使用Rprop只基于梯度符号并且针对性单独更新各权值。

2020-05-17 09:31:59 458

原创 解决深度学习代码中 No module named yaml

输入以下命令就好了。pip install PyYAML

2020-05-16 08:08:23 778

原创 基于反事实样本合成的鲁棒视觉问答模型《Counterfactual Samples Synthesizing for Robust Visual Question Answering》

这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收获。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Despite Visual Question Answering (VQA) has realized impressive progress over the last few years, today’s VQA models tend to capture superficial linguistic correlations in the train set and fa

2020-05-14 15:20:31 1661 1

原创 解决WinSCP无法用root用户登陆linux服务器

最近服务器容器改变,可以简单实用user 用户登录服务器,但是无法使用root登录,下面是解决方法。1.改写sshd_config文件用下面命令进入sshd_config里面。sudo vi /etc/ssh/sshd_config去除#,将PermitRootLogin 的值改成 yes去除#,将PermitEmptyPassword 的值改成 no按Esc,输入 :wq ,保存退出2.重启sshsudo service ssh restart至此就可以在Win.

2020-05-13 11:03:16 2678

原创 pyenv 安装 python 多版本

在学习和利用python开发的很多情况下,需要多版本的Python并存。此时需要在系统中安装多个Python,但又不能影响系统自带的 Python。pyenv 就是这样一个 Python 版本管理器。1.安装pyenvgit clone https://github.com/yyuu/pyenv.git ~/.pyenv2.配置环境变量echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bash_profileecho 'export

2020-05-13 10:56:20 276

原创 深度学习500问阅读笔记——为什么归一化能提高求解最优解速度?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。9.为什么归一化能提高求解最优解速度?如下图所示,两张图代表数据是否均一化的最优解寻解过程(圆圈可以理解为等高线)。左图表示未经归一化操作的寻解过程,右图表示经过归一化后的寻解过程。当使用梯度下降法寻求最优解时,很有可能走“之字形”路线(垂直等高线走),从而导致需要迭代很多次才能收敛;而右图对两个原始特...

2020-04-25 08:09:31 1015

原创 深度学习500问阅读笔记——如何解决过拟合与欠拟合?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。8.如何解决过拟合与欠拟合?如何解决欠拟合:1)添加其他特征项。组合、泛化、相关性、上下文特征、平台特征等特征是特征添加的重要手段,有时候特征项不够会导致模型欠拟合。2)添加多项式特征。例如将线性模型添加二次项或三次项使模型泛化能力更强。例如,FM模型、FFM模型,...

2020-04-23 15:40:46 390

原创 关于VMM的综合读后感

在1960年代末,虚拟机监控器(VMM)(图1)作为一种软件抽象层出现了,它将硬件平台划分为一个或多个虚拟机。这些虚拟机中的每一个都与基础物理机足够相似,可以运行未经修改的现有软件。当时,通用计算是大型,昂贵的大型机硬件的领域,用户发现VMM提供了一种在多种应用程序之间复用这种稀缺资源的引人注目的方法。因此,在短期内,该技术在工业界和学术研究中都蓬勃发展。但是,1980年代和1990年代带来了现代...

2020-04-22 20:15:59 191

原创 深度学习500问阅读笔记——图解欠拟合、过拟合

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。7.图解欠拟合、过拟合?根据不同的坐标方式,欠拟合与过拟合图解不同。1)横轴为训练样本数量,纵轴为误差如上图所示,可以直观看出欠拟合和过拟合的区别:模型欠拟合:在训练集以及测试集上同时具有较高的误差,此时模型的偏差较大;模型过拟合:在训练集上具有较低的误差,在测试集上具有较高的误...

2020-04-12 11:57:14 1025

原创 论文阅读之ACRN:物联网开发的大型小管理程序《ACRN: A Big Little Hypervisor for IoT Development》

1.摘要随着物联网(IoT)的快速增长和诸如边缘计算等新兴的IoT计算范例,普遍看到当今的实时和功能安全设备,尤其是工业IoT和汽车场景中的安全设备通过将多个平台组合为一个产品来实现功能。这一新趋势可能促使嵌入式虚拟化在工作负载合并,分离和成本效益方面成为有前途的解决方案。但是,管理程序(例如KVM和Xen)被设计为在服务器上运行,并且不能轻松地进行重组以满足诸如IoT产品的实时约束之类的要求...

2020-04-11 17:51:01 982

原创 深度学习500问阅读笔记——梯度下降?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。6.梯度下降?①梯度下降是迭代法的一种,可以用于求解最小二乘问题;②在求解机器学习算法的模型参数,即无约束优化问题时,主要有梯度下降(Gradient Descent)和最小二乘法。③在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值;④如果需要求解...

2020-04-04 21:59:45 398

原创 深度学习500问阅读笔记——大数据与深度学习的关系?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。5.大数据与深度学习的关系?大数据通常被定义为“超出常用软件工具捕获,管理和处理能力”的数据集。机器学习关心的问题是如何构建计算机程序使用经验自动改进。数据挖掘是从数据中提取模式的特定算法的应用。在数据挖掘中,重点在于算法的应用,而不是算法本身。(就我理解而言,数据挖掘就是找出大规模数据的潜在关...

2020-04-04 09:18:32 717

原创 深度学习500问阅读笔记——监督学习有哪些步骤?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。4.监督学习有哪些步骤?监督式学习:监督学习是使用已知正确答案的示例来训练网络。每组训练数据有一个明确的标识或结果,想象一下,我们可以训练一个网络,让其从照片库中(其中包含气球的照片)识别出气球的照片。以下就是在这个假设场景中所要采取的步骤。步骤1:数据集的创建和分类首先,浏览你的照片(数据集)...

2020-04-03 20:47:15 1507

原创 深度学习500问阅读笔记——监督学习、非监督学习、半监督学习、弱监督学习?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。3.监督学习、非监督学习、半监督学习、弱监督学习?根据数据类型的不同,对一个问题的建模有不同的方式。根据不同的学习方式和输入数据,机器学习主要分为以下四种学习方式。监督学习: ①监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程;...

2020-04-03 16:11:55 1163

原创 深度学习500问阅读笔记——机器学习为什么要使用概率?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。2.机器学习为什么要使用概率?事件的概率是衡量该时间发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。机器学习除了处理不确定量,也需处理随机量。不确定性和随机性可能来自多个方面,使用概率论来量化不确定性。概率论在机...

2020-04-03 10:22:52 452

原创 深度学习500问阅读笔记——张量与矩阵的区别?

这是深度学习500问系列笔记之一,帮助我深入记忆知识,如有不足,随时欢迎交流和探讨。1.张量与矩阵的区别?①从代数角度讲,矩阵它是向量的推广。向量可以看成一维的“表格”(即分量按照顺序排成一排),矩阵是二维的“表格”(即分量按照纵横位置排列),那么n阶张量就是所谓的n维的“表格”。张量的严格定义是利用线性映射来描述的。②从几何角度讲,矩阵是一个真正的几何量,也就是说,它是一个不随参照系...

2020-04-03 09:25:59 1960

原创 微内核发展史与Mach、L4、seL4微内核OS的比较

1.什么是微内核?微内核设计的基本思想是简化内核功能,在内核之外的用户态尽可能多地实现系统服务,同时加入相互之间的安全保护。内核只提供最基础的服务,比如多进程调度、多进程通信(IPC)等。其中进程通信是作为连接应用与用户态系统服务的桥梁。2.微内核的发展历史2.1第一代微内核:从无到有第一代微内核的主要代表是Mach,该系统由卡内基-梅隆大学的Avie Tevanian和Richa...

2020-03-30 09:01:09 4645

原创 常见的四种特征金字塔网络结构

为什么使用特征金字塔呢,是因为CNN对物体的平移是保持不变的,而对于物体的尺度变换是无法处理的,所以使用特征金字塔进行处理,下面进行介绍。1.Featurized image pyramid...

2020-03-19 15:22:56 40317 8

原创 论文阅读 之 “ THE”多程序系统的结构《The Structure of the "THE"-Multiprogramming System》

文章目录

2020-03-18 20:53:36 702

原创 python标准库~glob介绍

glob介绍glob文件名模式匹配,不用遍历整个目录判断每个文件是不是符合。1.通配符星号(*)匹配零个或多个字符import globfor name in glob.glob('name/*'): print(name)name\file1.txtname\file2.txtname\file3.txtname\file4.txtname\fi...

2020-02-22 09:13:42 221

转载 (nohup,ssh,screen,tensorboard,jupy...)服务器上跑深度学习代码的常用操作

1.如何连上远程服务器连上服务器首先,当然得是要用自己的PC连接上服务器。如果你的PC是linux系统,那么可以直接通过ssh指令进行远程访问,这里不详细说明。接下来我们主要说PC是windows上的操作。首先,我们要下一个用于ssh连接的工具,个人推荐的是MobaXterm。其打开后的界面如下图所示:然后我们依次文件->新建得到下图:配置好后直接ssh命令登录即可...

2020-02-21 14:34:32 1640

转载 Linux 使用vi命令 修改文件内容

vi编辑器是所有Unix及Linux系统下标准的编辑器,介绍一下它的用法和一小部分指令。由于对Unix及Linux系统的任何版本,vi编辑器是完全相同的,因此您可以在其他任何介绍vi的地方进一步了解它。Vi也是Linux中最基本的文本编辑器,学会它后,您将在Linux的世界里畅行无阻。在所有的命令执行前,先按Esc1、vi的基本概念  基本上vi可以分为三种状态,分别是命令模式(com...

2020-02-21 09:18:50 3203

原创 用于视觉问答的四元数乘积的多层内容交互模型《MULTI-LAYER CONTENT INTERACTION THROUGH QUATERNION PRODUCT FOR VQA》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Multi-modality fusion technologies have greatly improved the performance of neural network-based V...

2020-02-06 17:14:26 657

原创 从Transformers学习跨模态编码器表示《LXMERT: Learning Cross-Modality Encoder Representations from Transformers》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Vision-and-language reasoning requires an understanding of visual concepts, language semantics, an...

2020-02-04 16:36:40 6999

原创 用于视觉问答的统一视觉语言预训练模型《Unified Vision-Language Pre-Training for VQA》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍This paper presents a unified Vision-Language Pre-training (VLP) model. The model is unified in th...

2020-02-04 10:11:32 3802 2

原创 用于视觉问答的相互注意融合模型《Reciprocal Attention Fusion for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Existing attention mechanisms either attend to local image-grid or object level features for Visua...

2020-02-03 12:08:05 1143

原创 用于视觉问答的问题-引导混合卷积模型《Question-Guided Hybrid Convolution for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍In this paper, we propose a novel Question-Guided Hybrid Convolution (QGHC) network for Visual Que...

2020-02-03 09:14:10 908

原创 用于视觉问答的与问题无关的注意模型《Question-Agnostic Attention for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Visual Question Answering (VQA) models employ attention mechanisms to discover image locations tha...

2020-02-02 14:27:16 780 1

原创 用于视觉问答的基于关系推理和注意力的多峰特征融合模型《Multimodal feature fusion by relational reasoning and attention for VQA》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍The recently emerged research of Visual Question Answering (VQA) has become a hot topic in compute...

2020-02-01 21:08:13 1962 4

原创 《R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Recently, Visual Question Answering (VQA) has emerged as one of the most significant tasks in mult...

2020-02-01 12:00:29 713

原创 用于视觉问答的学习视觉知识记忆网络模型《Learning Visual Knowledge Memory Networks for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍Visual question answering (VQA) requires joint comprehension of images and natural language questi...

2020-01-31 14:13:59 1004

原创 《GQA:现实世界中的视觉推理》数据集介绍

此篇文章简单介绍了GQA数据集,是用于视觉问答的数据集,论文详细,PPT介绍,如有不如,欢迎大家交流。GQA—关于图像场景下的问答数据集。这是一个新的数据集,将被用于对现实世界中的图像进行视觉推理与组合回答的任务中。该数据集中包括了有关各种日常图像的近2000万条问题。每个图像都与一组场景图(scene graph)对应。每个问题都与其语义的结构化表示相关联在一起,并且约束应答者必须采用特定的...

2020-01-31 09:47:27 4580

原创 用于视觉问答的图形推理网络模型《Graph Reasoning Networks for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍The interaction between language and visual information has been emphasized in visual question ans...

2020-01-31 08:58:38 2091 3

原创 解释与注意:用于视觉问答的一场获得注意的两人游戏模型《Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍In this paper, we aim to obtain improved attention for a visual question answering (VQA) task. It ...

2020-01-30 12:28:42 698

原创 用于视觉问题回答的差异化注意力模型《Differential Attention for Visual Question Answering》

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论这是视觉问答论文阅读的系列笔记之一,本文有点长,请耐心阅读,定会有收货。如有不足,随时欢迎交流和探讨。一、文献摘要介绍In this paper we aim to answer questions based on images when provided with a dataset of question-...

2020-01-20 15:43:46 961

考研数据结构资料

考研数据结构资料考研数据结构资料考研数据结构资料考研数据结构资料考研数据结构资料考研数据结构资料

2018-07-14

dialog正在加载的dialog

正在加载的dialog

2016-03-29

正在加载的dialog

正在加载的dialog 需要的可以下载

2016-03-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除