是尘埃呀！-CSDN博客

原创基于频率增强的数据增广的视觉语言导航方法（VLN论文阅读）

基于频率增强的数据增广的视觉语言导航方法（VLN论文阅读），主要增强模型对高频频率的识别

2024-02-25 18:43:25 1477 3

原创安装matterport3d时报错：/usr/lib/libgdal.so.20: symbol TIFFReadRGBATileExt version LIBTIFF_4.0 not defined

就是判断到底哪个tiff 出了问题，根据stackflow的一个问答发现是版本问题，换了一个低版本的pytorch发现，确实重装了tiff包，但是换了低版本的之后便没有报错。虽然没有直接解决我的问题，但是提供了一个思路。

2023-09-06 14:29:35 481

原创使用adapter微调模型的简单教程

个人认为adapter只有在backbone比较大，学习的比较好的情况下有用，不适合一般的任务。———————尽管有代码，貌似没效果—————————我把它直接用在bert的输出层中，也可以用在其他地方。这个是adapter的代码块，可直接用。这个连接中有一个大模型微调的例子。解冻adapter模块。

2023-07-10 19:41:59 1460

原创 Aerial Vision-and-Dialog Navigation阅读报告

本文提出了一个空中/对话/导航任务，其目的是解放双手来控制无人机。为了完成这个任务，作者创建了一个来自真实图片的连续场景的无人机模拟器和一个具有3064条条轨迹的对话数据集。在对话的过程中，commander（用户角色）提供初始的导航指令和进一步的指导。fellower（无人机角色）在必要的时候提问。

2023-05-28 20:32:21 1492

HAMT模型虽然在每一步都记忆了当前和历史访问过的视觉信息但是，只能在局部做出行为决策（预测action），而基于graph的方法是对所有访问过的节点建立一个map，使得agent能够进行全局的决策，但仍然具有两个缺点：一是依赖于循环架构进行导航阻止了长期探索的能力，（不记忆是否访问过，访问过的节点还可能再次访问），另一方面是节点的视觉特征过于简单，虽然会降低复杂性，但也会忽略一些object的信息。也就是除了t步周围的可导航点，其他的点（访问过的点和不相邻的点（其他的蓝色的点））都设为。

2023-04-11 22:23:12 1415

原创 ubuntu下查看GPU真实使用情况的方式及解决显存不够的一般方法（gpustat）

ubuntu下查看GPU真实使用情况的方式及解决显存不够的一般方法（gpustat）

2023-03-02 11:44:06 3886

原创 VLN阶段性小结2023.1.10

视觉语言导航VLN任务阶段性总结2023.1.10

2023-01-10 18:00:10 2757 2

原创 Active Visual Information Gathering for Vision-Language Navigation

VLN阅读报告：Active Visual Information Gathering for Vision-Language Navigation

2022-11-10 22:06:07 1090 2

原创 VLN阅读报告9：Vision-Language Navigation with Self-Supervised Auxiliary Reasoning Tasks

Vision-Language Navigation with Self-Supervised Auxiliary Reasoning Tasks阅读报告

2022-11-09 19:42:44 677 1

原创【VLN阅读报告7：Vision-Language Navigation with Random Environmental Mixup】（ICCV2021)）

VLN阅读报告6：Vision-Language Navigation with Random Environmental Mixup

2022-11-05 16:52:41 1043

原创【VLN阅读报告8：History Aware Multimodal Transformer for Vision-and-Language Navigation】

阅读报告History Aware Multimodal Transformer for Vision-and-Language Navigation

2022-11-03 11:06:32 955

原创 VLN阅读报告5：CVDN：Vision-and-Dialog Navigation

VLN阅读报告：Vision-and-Dialog Navigation

2022-11-01 18:09:25 1678 1

原创 VLN阅读报告4：REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments(CVPR2020)

VLN阅读报告：REVERIE: Remote Embodied Visual Referring Expression inReal Indoor Environments

2022-11-01 17:13:45 1613

原创 VLN阅读报告3：（R2R）Interpreting visually-grounded navigation instructions in real environments

VLN阅读报告Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments

2022-11-01 16:05:12 2513

原创 VLN阅读报告6：SOON: Scenario Oriented Object Navigation with Graph-based Exploration

VLN阅读报告SOON: Scenario Oriented Object Navigation with Graph-based Exploration

2022-11-01 11:26:57 1349

原创阅读报告2：Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation

阅读报告Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigatio

2022-10-22 18:57:34 2600

原创 VLN小知识积累

小知识（不断更新）

2022-10-21 19:20:13 948

原创 VLN论文英语表达积累

VLN论文中的英语表达积累

2022-10-21 16:13:37 469

原创 VLN阅读报告1：Vision-and-Language Navigation综述（2022ACL）

VLN综述阅读报告（2022ACL）

2022-10-21 16:12:33 6284 2

原创【VLN学习内容LIST】

VLN学习内容list

2022-10-21 16:10:20 537

原创 Vision-Dialog Navigation和Vision-and-Language Navigation简单总结

Vision-and-Language Navigation的paper list

2022-09-18 20:53:29 1603

原创解决方式之一Caught AttributeError in replica 0 on device 0.

解决Caught AttributeError in replica 0 on device 0.

2022-08-27 14:50:20 2317 1

原创第一篇学术论文经验总结（草稿）

第一篇学术论文经验总结（草稿）**前提****写作****摘要****引言**，相关工作，方法，实验及结果，**结论。****改论文，改论文，改论文****科研工具**查文献工具翻译润色前提在写作之前的一些准备工作1阅读大量相关文献（精读10篇以上，泛读20篇以上）2复现别人的实验结果（3-5个以上）3论文写作，可以尝试写一篇综述，质量尽可能好，投不投稿不重要；也可以将日常阅读的文献写入博客或者做成ppt，像写日记一样，将学到的东西都在博客里记录4有创新点，创新点有效。一开始读论文的时候总是能脑

2022-05-20 13:55:29 1099

原创 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.内核版本不匹配

一nvidia-smiNVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.step1：sudo apt-get install dkmsstep2: sudo dkms install -m nvidia -v 440.44再次输入nvidia-smi时，你熟悉的界面

2022-05-16 00:25:33 682

原创断电断网等原因致使重新进入linux时系统进不去，进不了图形界面，出现/dev/sda2 recovery，clean，，，

断电断网等原因致使重新进入linux时系统进不去，进不了图形界面，出现/dev/sda2 recovery，clean，，，许多方法说是驱动问题，现在看来不是，至少不完全是，我的意思是重装驱动可能能解决问题，但是没必要。进入命令行状态ctrl+alt+f2原因一，某块硬盘占用已经满了查看磁盘占用:df -lh如果是/dev/sda2内存占用过大，则需要进一步查看文件夹无用文件，确定无用后删除即可删除命令：rm -rf 文件路径如果是/dev/loop 满了：sudo apt aut

2022-03-03 11:07:47 3035 1

原创将本地项目上传到Github(不用代码或命令行，直接拖拽文件夹)

一般github上传文件，一次只能上传一个，而且不能是文件夹我们可以创建2级目录文件，那么一级目录就成了一个文件夹而不是文件了。然后点击上传，拖拽即可。注意，第一次二级目录是创建而不是上传...

2022-03-02 10:30:17 1053

原创 python图像均匀加雾

注意输出的和保存的结果不一样，imshow的可能是全白也可能是全黑，但是imwrite可能是正常的。相反也是import cv2, mathimport numpy as npdef AddHaze1(img): # img_f = img # 保存文件用这行 img_f = img / 255.0 # 对原博主的代码进行了更改，这是显示时的样子 (row, col, chs) = img.shape A = 0.6 # 亮度 be

2022-02-27 19:35:49 4589 3

原创 2016-2021英语六级作文目录与翻译题目整理

2021-11-09 16:07:37 3691

原创 python打乱字典键对应的值

注意字典和列表的转换参考连接1参考连接2import randompath = 'train_test_ans2label.pkl' # path='/root/……/aus_openface.pkl' pkl文件所在路径f = open(path, 'rb')data = pickle.load(f)print(data)print('----------------------------------------------------------')k = data.ke

2021-09-15 20:39:21 401

原创 pytorch与以安装的cuda版本非必须

pytorch需要与cuda和python版本匹配，但是cuda11以后就没有python27的pytorch了想要继续使用只需要安装低版本cudatoolkit就行了

2021-09-14 03:31:43 1352

原创已解决Fatal Python error: init_fs_encoding: failed to get the Python codec of the filesystem encoding

这个是因为环境变量出错了Python path configuration:PYTHONHOME = ‘/home/admin888/miniconda3/bin’PYTHONPATH = ‘KaTeX parse error: Double subscript at position 66: ….9.2-hffdb5ce_0_̲cpython/lib/pyt…PYTHONPATH’,‘/home/admin888/miniconda3/pkgs/python-3.9.2-hffdb5ce_0_cp

2021-09-14 02:56:27 28470 1

转载 StopIteration: Caught StopIteration in replica 0 on device 0.解决

原文来自连接不是第一次遇到了，但是遇到了真不会改，我只用下面两步就好了1.torch报错：StopIteration: Caught StopIteration in replica 0 on device 0.原因：多GPU运行此项目报错，可能是torch版本错误。修改：按照别的博客将 weight = next(self.parameters()).data改为weight = torch.float322.仍报错：AttributeError: ‘torch.dtype’ no attrib

2021-09-14 02:12:09 3458 1

原创 linux卸载重新安装cuda，cudnn和pytorch的误区和相关常用命令

因为是卸载重装，所以假设本文读者之前安装过。有不明白的欢迎交流。有用链接这个链接给了安装过程中的截图，而本文主要是命令行。ubuntu 20.04 安装与卸载 Anaconda3 + CUDA 11.1 + cuDNN 8.0.5 + PyTorch 1.9.0_m0_52650517的博客-CSDN博客查看Ubuntu版本lsb_release -a查看cuda driver和gpu驱动状态版本nvidia-smi查看cuda runtim版本（runtim<=driver）.

2021-09-13 09:15:01 8304

原创如何快速在两个服务器之间传送大文件

通常连接服务器的方法是使用xftp等软件进行连接，并传送文件。但是，在本地使用xftp连接，需要经过自己的电脑网络转换，速度只有几M，传输大文件非常慢。使用以下命令，直接使用命令，让服务器a直接传输文件给目标服务器b，速度可达百兆。此行代码在服务器a运行scp -r /home/apaper2/data/coco admin10101@000.000.00.00:/home/datascp -r 要传输的文件位置目标服务器用户名@目标服务器域名：目标服务器位置注意看右下角传输速度...

2021-09-08 11:23:02 6909 1

原创论文阅读Check it again:Progressive Visual Question Answering via Visual Entailment

论文：Check it again:Progressive Visual Question Answering via Visual Entailment代码：https://github.com/PhoebusSi/SAR本文特点：处理语言先验，vqa-cp v2准确率66.73%，框架通用，基于暗示程度对最可能的几个答案重新排序一，介绍本文认为，最近开发的几种解决语言先验问题的方法，大多数是根据一个最好的输出来预测答案，不考虑答案的真实性，只探索图像与问题之间的相互作用，不考虑答案的语义。如图所

2021-09-06 10:33:35 677 2

原创多个json对象的json文件比较，并打印区别。

为了分析两个数据集预测值的差别，需要打印具有多个json对象的差别。两个json文件内容大致如下图所示：两个jison文件的question_id一样，每个id对应的answer可能不同。具体实现代码：import json as jsimport difflibimport sysf = open('data/css+v.json', encoding='UTF-8')m = open('data/css.json', encoding='UTF-8')x = js.load(f)

2021-05-10 10:10:29 669

原创基于继承的知识蒸馏（学生可以优于老师模型），整理中，，，

这个是阿里达摩院默照老师的一个分享截图，如有侵权，联系立删在这里插入图片描述

2021-04-24 21:17:13 445 1

原创目前绝大多数处理语言先验性文章总结

搬运自github（https://github.com/cdancette/vqa-cp-leaderboard#cl），如有侵权，联系立删！增加了两篇文章：1.Overcoming Language Priors in VQA via Decomposed Linguistic Representations——(AAAI2020)2.Overcoming Language Priors with Self-supervised Learning for Visual Question Answe.

2021-03-19 22:05:11 1229 2

原创 pytorch错误记录（陆续更新）

pytorch代码的错误和trick

2021-03-18 21:25:28 383

原创中文核心期刊目录汇总（2020年12月发布）

http://www.jdyy.cn/index.php/tsda/news/id/11523.html不断更新

2021-03-16 20:09:27 4336

视觉问答中所有语言先验，偏见的论文，代码，ppt

空空如也