科研论文阅读
文章平均质量分 93
全部梭哈迟早暴富
这个作者很懒,什么都没留下…
展开
-
【文献阅读】路径感知的图注意力做运动预测(Fang Da等人,ArXiv,ICRA 2022)
一、背景文章题目:《Path-Aware Graph Attention for HD Maps in Motion Prediction》文章下载地址:2202.13772.pdf (arxiv.org)https://arxiv.org/pdf/2202.13772.pdf文献引用格式:Fang Daand Yu Zhang. "Path-Aware Graph Attention for HD Maps in Motion Predict...原创 2022-05-03 11:13:56 · 921 阅读 · 0 评论 -
【文献阅读】用对比学习做弱监督语义分割(Sung-Hoon Yoon等人,ArXiv,2021)
一、背景文章题目:《Exploring Pixel-level Self-supervision for Weakly Supervised Semantic Segmentation》 文章下载地址:2112.05351.pdf (arxiv.org)https://arxiv.org/pdf/2112.05351.pdf 文献引用格式:Sung-Hoon Yoon,Hyeokjun Kweon, Jaeseok Jeong, Hyeonseong ...原创 2022-02-21 16:44:59 · 4597 阅读 · 0 评论 -
使用Landsat系列数据来检测喜马拉雅地区的冰湖溃决(Georg Veha等人,RSE,2018)
一、背景 这是一篇做冰湖溃决的文章,作者主要使用了random forest来检测喜马拉雅地区的冰湖溃决现象,这项成果发表在了Remote Sensing of Environment上。 文献连接:https://doi.org/10.1016/j.rse.2017.12.025文献引用:Georg Veha, Oliver Korupa, Sigrid Roessnerb, Ariane Walz.Detecting Himalayan glac...原创 2021-10-26 21:37:43 · 778 阅读 · 1 评论 -
【文献阅读】深度时空网络风力预测(Jiangyuan Li等人,ArXiv,2021)
一、背景文章题目:《Deep Spatio-Temporal Wind Power Forecasting》 文献下载地址:2109.14530.pdf (arxiv.org)https://arxiv.org/pdf/2109.14530.pdf文献引用格式:Jiangyuan Li and Mohammadreza Armandpour. "Deep Spatio-Temporal Wind Power Forecasting". arXiv pr...原创 2021-10-25 15:08:40 · 1947 阅读 · 0 评论 -
【文献阅读】ST-GDN——图神经网络预测交通流量(Xiyue Zhang等人,ArXiv,2021)
一、背景 文章题目:《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network》 文献下载地址:2110.04038.pdf (arxiv.org)https://arxiv.org/pdf/2110.04038.pdf文献引用格式:Xiyue Zhang, Chao Huang, Yong Xu, Lianghao Xia, Peng Dai,Liefeng Bo,...原创 2021-10-14 16:22:41 · 2679 阅读 · 6 评论 -
【文献阅读】图神经网络综述:方法,应用和机遇(L. Waikhom等人,ACM,2021)
一、文章概况 文章题目:《Graph Neural Networks: Methods, Applications, and Opportunities》 文章下载地址:[2108.10733] Graph Neural Networks: Methods, Applications, and Opportunities (arxiv.org)https://arxiv.org/abs/2108.10733 文章引用格式:LILAPATI WAIKHOM and RIPON PAT...原创 2021-10-12 14:49:26 · 611 阅读 · 0 评论 -
【文献阅读】小目标检测综述:挑战,技术和数据集(M. MUZAMMUL等人,ACM,2021)
一、文章概况 文章题目:《A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniques and Datasets》 这篇文章的内容实在太长了,这里就挑要点进行介绍了。 文章下载地址:https://arxiv.org/ftp/arxiv/papers/2107/2107.07927.pdf 文章引用格式:MUHAMMAD MUZAMMUL and XI LI....原创 2021-09-04 00:21:08 · 2356 阅读 · 0 评论 -
【文献阅读】AdVQA——人为干扰下的视觉问答数据集(Sasha Sheng等人,ArXiv,2021)
一、背景 文章题目:《》 文献下载地址: 文献引用格式: 项目地址:原创 2021-08-18 10:39:14 · 536 阅读 · 0 评论 -
【文献阅读】GraphVQA——语言导向的GNN解决场景图的问答(Weixin Liang等人,ArXiv,2021)
一、背景文章题目:《GraphVQA: Language-Guided Graph Neural Networks for Scene Graph Question Answering》和【文献阅读】LRTA——图网络解释VQA的答案生成过程(W. Liang等人,NeurIPS,2020)这一篇是同一个作者,内容也比较相似。文章下载地址:https://arxiv.org/pdf/2104.10283.pdf文章引用格式:Weixin Liang, Yanhao Jiang, Zixuan原创 2021-04-28 10:44:04 · 1426 阅读 · 1 评论 -
【文献阅读】MMQA——基于图像、文本和表格的问答(Alon Talmor等人,ICLR,2021)
一、背景文章题目:《MultiModalQA: Complex Question Answering Over Text, Tables and Images》文章下载地址:https://arxiv.org/pdf/2104.06039.pdf文章引用格式:Alon Talmor, Ori Yoran, Amnon Catav, Dan Lahav, Yizhong Wang, Akari Asai, Gabriel Ilharco, Hannaneh Hajishirzi and Jonat原创 2021-04-20 15:16:18 · 1956 阅读 · 0 评论 -
【文献阅读】PQA——感知问答的数据集和方法(Y. Qi等人,CVPR,2021)
一、背景文章题目:《PQA: Perceptual Question Answering》文章下载地址:https://arxiv.org/pdf/2104.03589.pdf文章引用格式:Yonggang Qi, Kai Zhang, Aneeshan Sain, Yi-Zhe Song. "Density Map Guided Object Detection in Aerial Images." In The IEEE Conference on Computer Vision and P原创 2021-04-09 17:49:46 · 948 阅读 · 0 评论 -
【文献阅读】SLAKE——医学图像的VQA双语数据集(Bo Liu等人,ArXiv,2021)
一、背景文章题目:《SLAKE: A Semantically-LabeledKnowledge-Enhanced Datasetfor Medical Visual Question Answering》文章下载地址:https://arxiv.org/pdf/2102.09542.pdf文章引用格式:Bo Liu,Li-Ming Zhan, Li Xu, Lin Ma, Yan Yang,Xiao-Ming Wu."SLAKE: A Semantically-LabeledKn...原创 2021-03-22 10:37:46 · 2653 阅读 · 2 评论 -
【文献阅读】VQA能干啥?VQA相关现实应用和未来挑战(Silvio Barraa等人,ArXiv,2021)
一、背景文章题目:《Visual Question Answering: which investigated applications?》文章下载地址:https://arxiv.org/pdf/2103.02937.pdf文章引用格式:Silvio Barraa, Carmen Bisognib, Maria De Marsicoc, Stefano Ricciardi."Visual Question Answering: which investigated applications..原创 2021-03-12 17:38:10 · 3802 阅读 · 3 评论 -
【文献阅读】BGN+AN——将答案看做属性组成的小样本VQA学习(D. Guo等人,ArXiv,2021)
一、文章概况文章题目:《Learning Compositional Representation for Few-shot Visual Question Answering》文章下载链接:https://arxiv.org/pdf/2102.10575.pdf文章引用格式:Dalu Guo and Dacheng Tao."Learning Compositional Representation for Few-shot Visual Question Answering".arXi...原创 2021-03-01 17:26:33 · 852 阅读 · 0 评论 -
【文献阅读】XVQA——一篇关于VQA的解释性研究(K. Alipour等人,ArXiv,2020)
一、文章概况文章题目:《A Study on Multimodal and Interactive Explanations for Visual Question Answering》文章下载链接:https://arxiv.org/pdf/2003.00431.pdf文章引用格式:Kamran Alipour,Jurgen P. Schulze,Yi Yao,Avi Ziskindand Giedrius Burachas."A Study on Multimodal and I...原创 2021-02-25 10:13:54 · 928 阅读 · 0 评论 -
【文献阅读】FloodNet——洪水灾害的VQA问答数据集(M. Rahnemoonfar等人,ArXiv,2020)
一、背景文章题目:《FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding》文章下载:https://arxiv.org/pdf/2012.02951.pdf文章引用:Maryam Rahnemoonfar, Tashnim Chowdhury, Argho Sarkar, Debvrat Varshney, Masoud Yari and Robin Murphy."Floo..原创 2020-12-21 17:16:34 · 2762 阅读 · 1 评论 -
【文献阅读】HieCoAttenVQA——分层协同注意力网络VQA(J. Lu等人,NIPS,2016,有代码)
一、背景文章题目:《Hierarchical Question-Image Co-Attention for Visual Question Answering》这篇文章比较早,所以就挑一些重要的内容来写。文章下载地址:https://arxiv.org/pdf/1606.00061.pdf文章引用格式:Jiasen Lu, Jianwei Yang, Dhruv Batra, Devi Parikh. "Hierarchical Question-Image Co-Attention fo原创 2020-12-08 16:03:04 · 1784 阅读 · 7 评论 -
【文献阅读】LRTA——图网络解释VQA的答案生成过程(W. Liang等人,NeurIPS,2020)
一、背景文章题目:《LRTA: A Transparent Neural-Symbolic Reasoning Framework with Modular Supervision for Visual Question Answering》这篇文章的核心内容只有5页,但是做的挺好,方法很新,读起来也非常容易理解。文章下载地址:https://arxiv.org/pdf/2011.10731.pdf文章引用格式:Weixin Liang,Feiyang Niu, Aishwarya Reg.原创 2020-12-03 11:18:28 · 1377 阅读 · 0 评论 -
【文献阅读】SelResVQA——具有自适应选择的学习模态内的关系(J. Hong等人,Neurocomputing,2020)
一、背景文章题目:《Selective residual learning for Visual Question Answering》文章下载地址:https://linkinghub.elsevier.com/retrieve/pii/S0925231220304859文章引用格式:Jongkwang Hong, Sungho Park, Hyeran Byun. Selective residual learning for Visual Question Answering.Neuro.原创 2020-11-26 15:11:11 · 1596 阅读 · 4 评论 -
【文献阅读】MLIN——对视觉区域和问题单词之间的关系进行建模(P. Gao等人,ICCV,2019)
一、背景文章题目:《Multi-modality Latent Interaction Network for Visual Question Answering》文章下载地址:https://openaccess.thecvf.com/content_ICCV_2019/papers/Gao_Multi-Modality_Latent_Interaction_Network_for_Visual_Question_Answering_ICCV_2019_paper.pdf文章引用格式:Linj原创 2020-09-28 11:37:11 · 1158 阅读 · 0 评论 -
【文献阅读】用于zero-shot识别的双曲视觉嵌入学习网络(S. Liu等人,CVPR,2020)
一、背景文章题目:《Hyperbolic Visual Embedding Learning for Zero-Shot Recognition》文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Hyperbolic_Visual_Embedding_Learning_for_Zero-Shot_Recognition_CVPR_2020_paper.pdf文献引用格式:Shaoteng Liu,Jingjing.原创 2020-09-07 16:51:15 · 1843 阅读 · 3 评论 -
【文献阅读】ReGAT——关系感知图注意力网络来提高VQA对图像中复杂语义的理解(L. Li等人,ICCV,2019)
一、背景文章题目:《Relation-Aware Graph Attention Network for Visual Question Answering》文章下载地址:https://ieeexplore.ieee.org/document/9010056或者https://openaccess.thecvf.com/content_ICCV_2019/papers/Li_Relation-Aware_Graph_Attention_Network_for_Visual_Question_A..原创 2020-09-01 14:35:16 · 2554 阅读 · 0 评论 -
【文献阅读】基于格网注意力的VQA比基于区域注意力的VQA更快更轻?(H. Jiang等人,CVPR,2020)
一、背景文章题目:《In Defense of Grid Features for Visual Question Answering》文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Jiang_In_Defense_of_Grid_Features_for_Visual_Question_Answering_CVPR_2020_paper.pdf文献引用格式:Huaizu Jiang, Ishan Misra, Mar原创 2020-08-25 15:12:42 · 582 阅读 · 1 评论 -
【文献阅读】MFB——结合协同注意力的多模态矩阵分解的双线性池化方法(Z. Yu等人,ICCV,2017,有代码)
一、背景文章题目:《Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering》文章下载地址:https://arxiv.org/pdf/1708.01471.pdf文章引用格式:Zhou Yu, Jun Yu, Jianping Fan, Dacheng Tao. "Multi-modal Factorized Bilinear Pooling with Co-原创 2020-08-19 16:58:18 · 5430 阅读 · 0 评论 -
【文献阅读】seada-VQA对数据进行对抗增强并保留语义正确性(R. Tang等人,ArXiv,2020)
一、背景文章题目:《Semantic Equivalent Adversarial Data Augmentation for Visual Question Answering》文章下载地址:https://arxiv.org/pdf/2007.09592.pdf文章引用格式:Ruixue Tang, Chao Ma, Wei Emma Zhang, Qi Wu, and Xiaokang Yang. "Semantic Equivalent Adversarial Data Augmenta原创 2020-08-06 10:52:36 · 1035 阅读 · 1 评论 -
【文献阅读】ChangeNet——变化检测网络(A. Varghese等人,ECCV,2018)
一、背景文章题目:《ChangeNet: A Deep Learning Architecture for Visual Change Detection》这篇文章思路非常简单,觉得能中ECCV还是有点牵强啊。变化检测一般就是孪生网络+反卷积,能还原出变化的mask就行,考虑到不同尺度下的变化特征,引入多尺度特征层就可以了。即使不看这篇文章,一般人也能想到这个思路。感觉能中ECCV有点玄学,因为亮点不多。文章下载地址:文章引用格式:Ashley Varghese, Jayavardhana原创 2020-08-04 17:07:20 · 5043 阅读 · 1 评论 -
【文献阅读】在VQA的答案空间中引入相似性测度(Corentin Kervadec等人,ArXiv,2020)
一、背景文章题目:《Estimating sementic structure for the VQA answer space》和前面的那篇文章是同一个团队:【文献阅读】GQA-OOD——测试低频样本问答的数据集和评估方法(Corentin Kervadec等人,ArXiv,2020,有代码),这篇文章的思路其实也比较好理解,就是因为一般答案环节都是用分类来做的, 无法度量相似类别,因此作者在答案空间进行了修改。文献下载地址:https://arxiv.org/pdf/2006.05726.p原创 2020-07-28 11:29:52 · 698 阅读 · 1 评论 -
【文献阅读】结合对抗网络和知识蒸馏,对多模态源的遥感图像分类(S. Pande等人,ICCV,2019)
一、背景文章题目:《An Adversarial Approach to Discriminative Modality Distillation for Remote Sensing Image Classification》遥感图像分类一直都是一个热门话题,这篇文章结合对抗网络和知识蒸馏来做遥感图像分类。亮点在于结合不同模态的数据。文章下载地址:https://openaccess.thecvf.com/content_ICCVW_2019/papers/CROMOL/Pande_An_Ad原创 2020-07-27 17:36:25 · 3141 阅读 · 1 评论 -
【文献阅读】用GAN来做遥感图像的变化检测(M. A. Lebedev等人,ISPRS,2018)
一、背景文章题目:《Change Detection In Remote Sensing Images Using Conditional Adversarival Networks》文章比较简单,且技术不是很新,所以这篇简要记录一下。文献下载地址:https://www.int-arch-photogramm-remote-sens-spatial-inf-sci.net/XLII-2/565/2018/isprs-archives-XLII-2-565-2018.pdf文献引用格式:M.原创 2020-07-17 11:12:19 · 2503 阅读 · 2 评论 -
【文献阅读】在遥感图像中引入密度图导向的目标检测(C. Li等人,CVPR,2020)
一、背景文章题目:《Density Map Guided Object Detection in Aerial Images》一篇目标检测的文章。文献下载地址:https://openaccess.thecvf.com/content_CVPRW_2020/papers/w11/Li_Density_Map_Guided_Object_Detection_in_Aerial_Images_CVPRW_2020_paper.pdf文献引用格式:Changlin Li, Taojiannan Y原创 2020-07-16 15:48:08 · 2105 阅读 · 2 评论 -
【文献阅读】EST-VQA——基于事实的场景文本VQA(X. Wang等人,CVPR,2020)
一、背景文章题目:《On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering》这篇文章是关于场景文本的研究。文章下载地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Wang_On_the_General_Value_of_Evidence_and_Bilingual_Scene-Text_Visual_CVPR_202原创 2020-07-14 10:30:18 · 1689 阅读 · 2 评论 -
【文献阅读】用于遥感图像土地覆盖分类的元学习(M. Rußwurm等人,CVPR,2020)
一、背景文章题目:《Meta-Learning for Few-Shot Land Cover Classification》CVPR2020里面专门添加了遥感领域的相关工作,连接:https://openaccess.thecvf.com/CVPR2020_workshops/CVPR2020_w56文献下载地址:https://openaccess.thecvf.com/content_CVPRW_2020/papers/w11/Russwurm_Meta-Learning_for_Fe原创 2020-07-09 16:06:43 · 1017 阅读 · 0 评论 -
【文献阅读】CSS-VQA——一种提升VQA模型的视觉可解释性和问题敏感性的训练机制(L. Chen等人,CVPR,2020,有代码)
一、背景文章题目:《Counterfactual Samples Synthesizing for Robust Visual Question Answering》CVPR2020的文章已经公布了,看了一下,这一届VQA的文章很少。文章下载地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_Counterfactual_Samples_Synthesizing_for_Robust_Visual_Question_Answ原创 2020-07-03 15:59:57 · 1223 阅读 · 0 评论 -
【文献阅读】GQA-OOD——测试低频样本问答的数据集和评估方法(Corentin Kervadec等人,ArXiv,2020,有代码)
一、背景文章题目:《Roses are red, violets are blue ... but should VQA expect them to ?》这篇文章的作者都是来自于法国的Orange Labs,读这篇文章的原因是题目起的非常艺术,不像一般起名都是“基于。。。的方法”之类。文章下载地址:https://arxiv.org/pdf/2006.05121.pdf文献引用格式:Corentin Kervadec, Grigory Antipov, Moez Baccouche and原创 2020-06-22 14:39:01 · 1319 阅读 · 0 评论 -
【文献阅读】MUTAN——多模态塔克融合VQA模型(Hedi Ben-younes等人,ArXiv,2017,有代码)
一、背景文章题目:《MUTAN: Multimodal Tucker Fusion for Visual Question Answering》17年的一篇文章,不过后面看到很多文献引用了这篇,所以还是记录一下。文章下载地址:https://arxiv.org/pdf/1705.06676.pdf文献引用格式:Hedi Ben-younes, R´emi Cadene, Matthieu Cord and Nicolas Thome. (2017) "MUTAN: Multimodal Tu原创 2020-06-04 17:13:39 · 3888 阅读 · 1 评论 -
【文献阅读】SAAA——堆叠多层注意力的VQA网络(T. Do等人,ArXiv,2017,有代码)
一、背景文章题目:《Show, Ask,Attend, and Answer:A Strong Baseline For Visual Question Answering》ArXiv上的一篇文章,虽然是17年的比较早,但是比较经典,后面看到很多新的模型都与这个模型进行了对比。看了一下模型结构,算是SAN网络的升级版吧。文章下载地址:https://arxiv.org/pdf/1704.03162.pdf文章引用格式:Vahid Kazemi and Ali Elqursh. "Show,.原创 2020-06-03 10:35:11 · 834 阅读 · 0 评论 -
【文献阅读】BLOCK——用于VQA的双线性超对角融合模型(Hedi Ben-younes等人,AAAI,2019,有代码)
一、背景文章题目:《BLOCK: Bilinear Superdiagonal Fusion for Visual Question Answering and Visual Relationship Detection》AAAI2019的一篇文章。文章下载地址:https://aaai.org/ojs/index.php/AAAI/article/download/4818/4691文章引用格式:Hedi Ben-younes, Remi Cadene, Nicolas Thome, Ma原创 2020-06-02 11:00:13 · 2342 阅读 · 0 评论 -
【文献阅读】将VQA视作元学习(Damien Teney等人,ECCV,2018)
一、背景文章题目:《Visual Question Answering as a Meta Learning Task》ECCV2018的一篇文章。元学习和VQA的结合,非常值得关注。文章下载地址:http://openaccess.thecvf.com/content_ECCV_2018/papers/Damien_Teney_Visual_Question_Answering_ECCV_2018_paper.pdf文章引用格式:Damien Teney and Anton van den原创 2020-05-29 17:23:59 · 711 阅读 · 0 评论 -
【文献阅读】VQA中的原因生成(H. A. Ayyubi等人,ArXiv,2020)
一、背景文章题目:《Generating Rationales in Visual Question Answering》Arxiv上比较新的一篇文章。作者全部来自于UC San Diego。这篇文章重点研究的是VQA模型的可解释性,个人感觉和【文献阅读】VQA-E——一种对预测答案解释的模型和数据集(Q. Li等人,ECCV,2018)这一篇文章的思路差不多。文章下载地址:https...原创 2020-05-12 17:37:34 · 709 阅读 · 1 评论 -
【文献阅读】小样本学习综述:A Survey on Few-Shot Learning(Y. Wang, 等人,ArXiv,201904)
一、背景文章题目:《Generalizing from a Few Examples: A Survey on Few-Shot Learning》VQA的工作暂时告一段落,接下来将要重点关注小样本学习方向,所以先从这篇综述开始文章下载地址:https://arxiv.org/pdf/1904.05046.pdf文章引用格式:Y. WANG, Q. YAO, J. KWOK, L....原创 2020-01-16 10:27:54 · 5332 阅读 · 2 评论