自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bxg1065283526的博客

学习笔记

  • 博客(128)
  • 收藏
  • 关注

原创 Android studio使用WebView提示net ERR_FILE_NOT_FOUND

出现这个错误的原因为找不到目标加载的html1、首先确定创建的assets文件夹名字、位置。名字必须为assets,位置需要在app文件夹下,与java、res为同一层加2、确定html的路径,file:///android_asset/www/security.html,其中必须为android_asset,不能写成assets...

2021-03-04 19:59:45 2093 1

原创 错误UserWarning: semaphore_tracker: There appear to be 4 leaked semaphores to clean up at shutdown

最近在跑代码的时候总是会遇到这个错误,明明是UserWarning,但是程序会停止运行,错误提示为multiprocessing/semaphore_tracker.py:144: UserWarning: semaphore_tracker: There appear to be 4 leaked semaphores to clean up at shutdown len(cache))查了很多资料,这个问题似乎很早之前就有,最早能找到的是在2013年,但是没有什么很好的解决方法,最终发现

2020-09-04 14:31:49 20907 11

原创 In Defense of Grid Features for Visual Question Answering论文笔记

Abstract作为“自底向上”关注[2],基于边界框(或区域)的视觉特征最近已经超过了普通的基于网格的卷积特征,成为视觉和语言任务(如视觉问题回答(VQA))的事实标准。然而,还不清楚地区的区域(例如更好的定位)是否是自下而上注意力成功的关键原因。在这篇文章中,我们重新审视了VQA的网格特性,发现它们可以非常好地工作——以同样的精度运行速度快一个数量级以上(例如,如果以类似的方式预先训练)。通过大量的实验,我们验证了这一观察结果在不同的VQA模型(报告了vqa2.0测试标准72.71的最新精度)、数据

2020-07-18 16:09:33 1378

原创 Counterfactual Samples Synthesizing for Robust Visual Question Answering论文笔记

Abstract尽管视觉问答(VQA)在过去几年中已经取得了令人瞩目的进步,但是当今的VQA模型倾向于捕获训练集中的表层语言相关性,而不能推广到具有不同QA分布的测试集中。为了减少语言偏见,最近的一些工作引入了一个辅助的仅问题模型,以规范化目标VQA模型的训练,并在VQA-CP上实现主导性能。但是,由于设计的复杂性,当前的方法无法为基于集成模型的模型配备理想VQA模型的两个必不可少的特征:1)视觉可解释的:模型在做出决策时应依赖正确的视觉区域。 2)对问题敏感:该模型应对所讨论的语言变化敏感。为此,我们

2020-05-28 22:59:51 1642

翻译 Visual Question Answering: A Survey of Methods and Datasets

Abstract视觉问答(VQA)是一项具有挑战性的任务,已受到计算机视觉和自然语言处理社区的越来越多的关注。给定图像和自然语言的问题,就需要对图像的视觉元素和常识进行推理,以推断出正确的答案。在本调查的第一部分中,我们通过比较解决问题的现代方法来检查最新技术。我们通过它们将视觉和文本模态联系起来的机制对方法进行分类。特别是,我们研究了结合卷积神经网络和递归神经网络将图像和问题映射到公共特征空间的通用方法。我们还将讨论与结构化知识库交互的内存增强型和模块化体系结构。在本调查的第二部分,我们回顾了可...

2020-05-22 17:50:52 3007 3

翻译 An Analysis of Visual Question Answering Algorithms翻译

Abstract在视觉问答(VQA)中,算法必须回答关于图像的基于文本的问题。尽管自2014年末以来,VQA已经创建了多个数据集,但它们在内容和算法评估方式上都存在缺陷。结果,评估分数被夸大了,而且主要是通过回答更简单的问题来决定的,这使得比较不同的方法变得很困难。在本文中,我们使用一个名为任务驱动图像理解挑战(TDIUC)的新数据集来分析现有的VQA算法,该数据集有超过160万个问题,分为12个不同的类别。我们还引入了对给定图像没有意义的问题,以迫使VQA系统对图像内容进行推理。我们提出新的评估方案,

2020-05-19 23:40:55 634

原创 Don’t Take the Easy Way Out: Ensemble Based Methods for Avoiding Known Dataset Biases论文笔记

Abstract最先进的模型通常利用数据中的表面模式,这些表面模式不能很好地推广到域外或对抗性设置中。例如,文本蕴涵模型经常了解特定的关键词暗示蕴涵,而与上下文无关,而视觉问答模型则学会预测原型答案,而无需考虑图像中的证据。在本文中,我们表明,如果我们对此类偏差有先验知识,则可以训练该模型对域移位更健壮。我们的方法分为两个阶段:我们(1)训练仅基于数据集偏差进行预测的朴素模型,以及(2)训练与朴素模型合而为一的稳健模型,以鼓励它专注于其他模式在更可能泛化的数据中。对具有域外测试集的五个数据集进行的实验表

2020-05-17 14:48:29 1392

翻译 Don’t Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering——论文阅读笔记

Abstract许多研究发现,今天的视觉问题回答(VQA)模型主要受训练数据中表面相关性的驱动,缺乏足够的图像基础。为了鼓励开发面向后者的模型,我们为VQA提出了一个新的环境,在这个环境中,对于每种类型的问题,训练集和测试集都有不同的答案先验分布。具体来说,我们提出了VQA v1和VQA v2数据集的新分割,我们称之为改变先验下的视觉问题回答(分别为VQA- CP v1和VQA-CP v2)。首先,我们在这种新的设置下评估了几个现有的VQA模型,并表明它们的性能与原始的VQA设置相比显著下降。第二,我们

2020-05-14 14:32:43 16845

翻译 Visual Question Answering: Datasets, Algorithms, and Future Challenges文章翻译

Abstract视觉问答(VQA)是计算机视觉和自然语言处理领域的一个新问题,引起了深度学习、计算机视觉和自然语言处理领域的极大兴趣。在VQA,一种算法需要回答基于文本的图像问题。自2014年第一个VQA数据集发布以来,已经发布了更多数据集,并提出了许多算法。在这篇综述中,我们从问题表述、现有数据集、评估指标和算法等方面批判性地考察了VQA的现状。特别是,我们讨论了当前数据集在正确训练和评估V...

2020-05-08 22:09:02 1757

原创 VQA中的attention机制

近年来,attention机制在深度学习领域受到了越来越多的关注。从数学的形式上看,attention机制只是简单地对输入项根据重要程度分配不同的加权参数,但这一机制模拟了人脑的认知模式,即根据实际需求而将有限的注意力聚焦于事物的关键部分,从而大大加强了神经网络的理解能力。由于VQA涉及对图像和文字的深度理解,attention机制在VQA领域自然成了一大利器。于是这周就将attention机制...

2020-04-16 00:41:26 3098 1

原创 Object-Difference Attention: A Simple Relational Attention for Visual Question Answering

Abstract注意分布根据注意问题的重要性在图像中的对象(例如图像区域或边界框)上具有不同的权重分布,它在注意机制中起着至关重要的作用。现有的大多数工作都集中在融合图像特征和文本特征来计算注意力分布的情况下,而不需要在不同图像对象之间进行比较。作为关注的主要属性,选择性取决于不同对象之间的比较。比较提供了更多信息,可以更好地分配注意力。作者提出了一种对象差异注意(ODA),该方法通过在手头问...

2020-04-12 23:15:40 747

原创 Focal Visual-Text Attention for Visual Question Answering论文笔记

Abstract神经网络对语言和视觉的最新见解已经成功地应用于简单的单图像视觉问题回答。然而,为了解决诸如个人照片等多媒体收藏中的现实问题,我们必须用一系列照片或视频来观察整个收藏。当回答来自大量集合的问题时,一个自然的问题是识别支持答案的片段。在本文中,我们描述了一种新的神经网络,称为焦点视觉文本注意网络(FVTA),用于视觉问题回答中的集体推理,其中视觉和文本序列信息,例如图像和文本元数据...

2020-03-31 18:18:57 787

原创 Dual Attention Networks for Multimodal Reasoning and Matching

Abstract作者提出了一个网络DAN,同时视觉注意力和文本注意力,利用注意力能够关注图片中的某一区域和句子中的某一个单词,推理模型允许在协作推理过程中,视觉和文本的注意力相互引导。此外,该匹配模型利用两种注意机制,通过关注图像和句子的共同语义来估计它们之间的相似度。1. Introduction...

2020-03-29 17:08:13 760

原创 Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering论文笔记

Abstract基于双线性池的模型已经被证明优于传统的VQA线性模型,但是它们的高维表示和高计算复杂度可能严重限制它们在实践中的适用性。对于多模态特征融合,作者提出了一种多模态分解双线性(MFB)汇集方法,以高效和有效地组合多模态特征,这使得VQA的性能优于其他双线性汇集方法。对于细粒度的图像和问题表示,作者提出了一种“共同关注”机制,使用端到端的深层网络架构来共同学习图像和问题关注。在一个新...

2020-03-25 21:05:23 2178

原创 高低位交换

题目描述:输入一个无符号整数n(unsigned int类型),n可以用一个32位的二进制数表示(不足32位用0补足),我们称这个二进制数的前16位为“高位”,后16位为“低位”,输出将n的高位和低位交换后的值(用十进制表示)。例如:输入1314520,它的二进制表示为0000 0000 0001 0100 0000 1110 1101 1000(添加了11个0补足为32位),其中前16位...

2020-03-25 00:51:00 8866

原创 Multi-level Attention Networks for Visual Question Answering论文笔记

Abstract现有方法主要从抽象的低层视觉特征推断答案,而忽略了高层图像语义的建模和丰富的区域空间上下文。为了解决这一问题,作者提出了一个多层次的视觉问题回答注意网络,该网络既可以通过语义注意减少语义鸿沟,并有利于通过视觉注意进行细粒度的空间推理。首先,从卷积神经网络的高层语义中生成语义概念,并选择那些与问题相关的概念作为语义注意。其次,通过双向递归神经网络将CNN的基于区域的中层输出编码成...

2020-03-23 13:20:25 885

原创 Attention Is All Your Need论文笔记

Abstract主要的序列转导模型基于包括编码器和解码器的复杂递归或卷积神经网络。表现最好的模型也通过注意机制连接编码器和解码器。作者提出了一个新的简单的网络结构,变压器,完全基于注意机制,完全免除了递归和卷积。在两个机器翻译任务上的实验表明,这些模型在质量上是优越的,同时具有更好的并行性,并且需要更少的训练时间。1 Introduction针对nlp里的机器翻译问题,提出了一种被称为...

2020-03-21 22:30:39 335

原创 Visual Question Answering as Reading Comprehension论文笔记

Abstract视觉问答(VQA)要求同时理解图像视觉内容和自然语言问题。在某些情况下,推理需要常识或一般知识的帮助,这些知识通常以文本的形式出现。当前的方法将视觉信息和文本特征共同嵌入到同一空间中。然而,如何模拟两种不同模式之间复杂的相互作用并不容易。与多模态特征融合的努力相反,本文提出用自然语言统一所有输入信息,从而将VQA问题转化为机器阅读理解问题。通过这种转换,不仅可以处理侧重于基于观...

2020-03-21 00:25:47 807 1

原创 Hierarchical Question-Image Co-Attention for Visual Question Answering论文笔记

1.Abstract作者认为之前的工作集中在寻找图片中的重点区域,但是也应该寻找问题中的重要的单词,所以提出了共同注意力(co-attention),目的是共同的推理图片和问题的注意力。2.Introduction作者提出的共同注意力具有以下两种特征:Co-Attention 与之前的工作不同,作者的提出的模型是对称的,通过图片表示可以引导产生问题的注意力,问题表示可以引导产生图片...

2020-03-19 00:23:28 837

原创 Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention论文笔记

Abstract视觉问答(VQA)的关键解决方案在于如何融合从输入图像和问题中提取的视觉和语言特征。我们表明,一种能够在两种模式之间实现密集双向交互的注意机制有助于提高答案预测的准确性。具体来说,我们提出了一个在视觉和语言表达之间完全对称的简单体系结构,其中每个问题词出现在图像区域,每个图像区域出现在问题词上。它可以被堆叠以形成图像-问题对之间的多步骤交互的层次。我们通过实验表明,所提出的架构...

2020-03-17 22:43:45 733 1

原创 Deep Modular Co-Attention Networks for Visual Question Answering读书笔记

Abstract视觉问答(VQA)要求对图像的视觉内容和问题的文本内容都具有细粒度的同时理解。因此,设计有效的“共同注意”模型以将问题中的关键词与图像中的关键对象相关联是VQA性能的关键。到目前为止,通过使用浅层模型已成功完成了对注意力集中学习的大多数成功尝试,而深层共同注意模型相对于浅层模型几乎没有改善。在本文中,我们提出了一个深度的模块化协同注意网络(MCAN),该网络由深度级联的模块化协...

2020-03-13 17:39:50 1616 1

原创 2019年VQA论文整理

1、Attention 目前大部分工作都存在使用Attention机制,使用Attention主要是找到图片中与答案的相关的图片区域。 (1)Stacked Attention Networks for Image Question Answering...

2020-03-06 14:45:43 4222 3

原创 Multi-Modal Multi-Scale Deep Learning for Large-Scale Image Annotation

AbstractImage annotation aims to annotate a given image with a variable number of class labels corresponding to diverse visual concepts. In this paper, we address two main issues in large-scale imag...

2019-09-03 14:17:23 2851 1

原创 Recent Advances in Zero-Shot Recognition(Toward data-efficient understanding of visual content)

AbstractWith the recent renaissance of deep convolutional neural networks (CNNs), encouraging breakthroughs have been achieved on the supervised recognition tasks, where each class has sufficient an...

2019-08-30 19:55:04 2457

原创 Out-of-Distribution Detection for Generalized Zero-Shot Action Recognition

AbstractGeneralized zero-shot action recognition is a challenging problem, where the task is to recognize new action categories that are unavailable during the training stage, in addition to the se...

2019-07-19 16:03:16 2596

原创 记一次失败的面试题

写在前面,这是前几去面试一份笔试题,自己做的简直太糟糕了,暴露出了自己的基础知识实在是太不扎实了,自己面试也没有什么准备,所以就将题带回来了,现在完整的做一遍,警醒自己也作复习之用。1、程序的局部变量存在于(堆栈)中,全局变量存在于(数据段)中,动态申请数据存在于(堆空间)中注意:初始化过的全局变量存在于数据段中,未初始化的存在于bss段。2、下列语句中p的含义int *p[n];...

2019-05-05 16:40:09 305

原创 位运算小结

1、补码十进制转换为二进制需要除2取余,将十进制负整数转换为二进制可以先按照正数转换,然后取反加1十进制10的二进制表示0000 0000 0000 1010取反后1111 1111 1111 0101加11111 1111 1111 01102、按位与(&)参加运算的两个数换算成二进制后,进行位运算,相应位都为1时取1,否则取0将10与-10进行按位与运...

2019-05-05 10:36:27 186

原创 中国人民大学信息学院夏令营经验贴

1.报名人大的夏令营报名时间一般在五月初就会发布通知,六月一号就会截止。需要在学校的一个网站上报名,一般材料就包括成绩排名,成绩单,四六级成绩,各种获奖证明,推荐信(直博需要)。在报名过后,在京内的同学可以尝试联系一下导师,看是否有机会提前进入实验室帮忙学习,有助于增加录取率。关于报名什么专业,人大今年第一次增加了大数据科学与工程这个专业,好多名额都分配给这个专业,建议报考大数据和计算机应...

2018-07-26 10:40:59 12034 20

原创 排序算法

1.快速排序#include<stdio.h>#include<iostream>using namespace std;void P(int a[],int n){ for(int i=0; i<n; i++) cout<<a[i]<<" "; cout<<endl;}void quic..

2018-07-04 22:17:29 237

原创 1001:求高精度幂

Description对数值很大、精度很高的数进行高精度计算是一类十分常见的问题。比如,对国债进行计算就是属于这类问题。 现在要你解决的问题是:对一个实数R( 0.0 < R < 99.999 ),要求写程序精确计算 R 的 n 次方(Rn),其中n 是整数并且 0 < n <= 25。InputT输入包括多组 R 和 n。 R 的值占第 1 到第 6 列,n 的值占第 8...

2018-06-01 22:08:23 379

原创 openjudge 百练 4148 生理周期

总时间限制: 1000ms内存限制: 65536kB描述人生来就有三个生理周期,分别为体力周期、感情周期和智力周期,它们的周期长度分别为23天、28天和33天。每一个周期中有一天是高峰。在高峰这天,人会在相应的方面表现出色。例如,在智力周期的高峰,人会思维敏捷,注意力容易高度集中。因为三个周期的长度不同,所以通常三个周期的高峰不会落在同一天。对于每个人,想知道何时三个高峰落在同一天。对于每个周期,...

2018-05-17 20:23:45 459

原创 改善深层神经网络第二周-Optimization methods(优化方法)

Optimization MethodsUntil now, you’ve always used Gradient Descent to update the parameters and minimize the cost. In this notebook, you will learn more advanced optimization methods that can speed up...

2018-05-06 10:51:01 946

原创 改善深层神经网络第一周-Gradient Checking(梯度检查)

Gradient CheckingWelcome to the final assignment for this week! In this assignment you will learn to implement and use gradient checking.You are part of a team working to make mobile payments availabl...

2018-05-04 22:05:31 1212

原创 改善深层神经网络第一周-Regularization(正则化)

RegularizationWelcome to the second assignment of this week. Deep Learning models have so much flexibility and capacity that overfitting can be a serious problem, if the training dataset is not big en...

2018-05-04 20:43:07 709

原创 改善深层神经网络第一周-Initialization

InitializationWelcome to the first assignment of “Improving Deep Neural Networks”.Training your neural network requires specifying an initial value of the weights. A well chosen initialization method ...

2018-05-03 23:37:06 382

转载 神经网络与深度学习第四周-Building your Deep Neural Network - Step by Step

Building your Deep Neural Network: Step by StepWelcome to your week 4 assignment (part 1 of 2)! You have previously trained a 2-layer Neural Network (with a single hidden layer). This week, you will b...

2018-05-03 20:35:58 604

原创 《神经网络和深度学习》之神经网络基础(第三周)课后作业——一个隐藏层的平面数据分类

由于没有找到课后练习,所有练习文章均参考点击打开链接,我已经将所有代码都实现过一遍了,没有错误,感谢博主欢迎来到第三周的课程,在这一周的任务里,你将建立一个只有一个隐含层的神经网络。相比于之前你实现的逻辑回归有很大的不同。你将会学习一下内容:用一个隐含层的神经网络实现一个二分类。利用非线性的激活函数单元。计算交叉熵损失函数。实现向前传播和向后传播。1 函数包# Package importsim...

2018-05-02 11:26:14 1761 3

原创 8.python数据分析与展示

1.数据的排序pandas库的数据排序:.sort_index()方法在指定轴上根据索引进行排序,默认升序                              .sort_index(axis=0, ascending=True)import pandas as pdimport numpy as npb=pd.DataFrame(np.arange(20).reshape(4,5),...

2018-04-30 12:30:46 297

原创 7.python数据分析与展示------Pandas库入门

1.Pandas库的介绍Pandas是Python第三方库,提供高性能易用数据类型和分析工具             import    pandas as   pdPandas基于Numpy实现,常与Numpy和Matplotlib一同使用import pandas as pdd =pd.Series(range(20))print(d)# 0 0# 1 1# 2...

2018-04-29 23:32:42 486

原创 6.python数据分析与展示------引力波的绘制

1.概念引力波:物理学中,引力波是因为时空弯曲对外以辐射形式传播的能量爱因斯坦基于广义相对论预言了引力波的存在2015年9月14日,LIGO合作组宣布探测到首个引力波信号。 2016年6月16日,LIGO合作组宣布2015年12月26日03:38:53(UTC),两台不同位置的引力波探测器同时探测到了一个引力波信号。import numpy as npimport matplotlib.pypl...

2018-04-29 16:50:25 1608

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除