- 博客(70)
- 资源 (1)
- 收藏
- 关注
原创 基于频率增强的数据增广的视觉语言导航方法(VLN论文阅读)
基于频率增强的数据增广的视觉语言导航方法(VLN论文阅读),主要增强模型对高频频率的识别
2024-02-25 18:43:25
1477
3
原创 安装matterport3d时报错:/usr/lib/libgdal.so.20: symbol TIFFReadRGBATileExt version LIBTIFF_4.0 not defined
就是判断到底哪个tiff 出了问题,根据stackflow的一个问答发现是版本问题,换了一个低版本的pytorch发现,确实重装了tiff包,但是换了低版本的之后便没有报错。虽然没有直接解决我的问题,但是提供了一个思路。
2023-09-06 14:29:35
481
原创 使用adapter微调模型的简单教程
个人认为adapter只有在backbone比较大,学习的比较好的情况下有用,不适合一般的任务。———————尽管有代码,貌似没效果—————————我把它直接用在bert的输出层中,也可以用在其他地方。这个是adapter的代码块,可直接用。这个连接中有一个大模型微调的例子。解冻adapter模块。
2023-07-10 19:41:59
1460
原创 Aerial Vision-and-Dialog Navigation阅读报告
本文提出了一个空中/对话/导航任务,其目的是解放双手来控制无人机。为了完成这个任务,作者创建了一个来自真实图片的 连续场景的 无人机模拟器 和 一个具有3064条条轨迹的对话数据集。在对话的过程中,commander(用户角色)提供初始的导航指令和进一步的指导。fellower(无人机角色)在必要的时候提问。
2023-05-28 20:32:21
1492
原创 DUET详解草稿
HAMT模型虽然在每一步都记忆了当前和历史访问过的视觉信息但是,只能在局部做出行为决策(预测action),而基于graph的方法是对所有访问过的节点建立一个map,使得agent能够进行全局的决策,但仍然具有两个缺点:一是依赖于循环架构进行导航阻止了长期探索的能力,(不记忆是否访问过,访问过的节点还可能再次访问),另一方面是节点的视觉特征过于简单,虽然会降低复杂性,但也会忽略一些object的信息。也就是除了t步周围的可导航点,其他的点(访问过的点和不相邻的点(其他的蓝色的点))都设为。
2023-04-11 22:23:12
1415
原创 ubuntu下查看GPU真实使用情况的方式及解决显存不够的一般方法(gpustat)
ubuntu下查看GPU真实使用情况的方式及解决显存不够的一般方法(gpustat)
2023-03-02 11:44:06
3886
原创 Active Visual Information Gathering for Vision-Language Navigation
VLN阅读报告:Active Visual Information Gathering for Vision-Language Navigation
2022-11-10 22:06:07
1090
2
原创 VLN阅读报告9:Vision-Language Navigation with Self-Supervised Auxiliary Reasoning Tasks
Vision-Language Navigation with Self-Supervised Auxiliary Reasoning Tasks阅读报告
2022-11-09 19:42:44
677
1
原创 【VLN阅读报告7:Vision-Language Navigation with Random Environmental Mixup】(ICCV2021))
VLN阅读报告6:Vision-Language Navigation with Random Environmental Mixup
2022-11-05 16:52:41
1043
原创 【VLN阅读报告8:History Aware Multimodal Transformer for Vision-and-Language Navigation】
阅读报告History Aware Multimodal Transformer for Vision-and-Language Navigation
2022-11-03 11:06:32
955
原创 VLN阅读报告5:CVDN:Vision-and-Dialog Navigation
VLN阅读报告:Vision-and-Dialog Navigation
2022-11-01 18:09:25
1678
1
原创 VLN阅读报告4:REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments(CVPR2020)
VLN阅读报告:REVERIE: Remote Embodied Visual Referring Expression inReal Indoor Environments
2022-11-01 17:13:45
1613
原创 VLN阅读报告3:(R2R)Interpreting visually-grounded navigation instructions in real environments
VLN阅读报告Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments
2022-11-01 16:05:12
2513
原创 VLN阅读报告6:SOON: Scenario Oriented Object Navigation with Graph-based Exploration
VLN阅读报告SOON: Scenario Oriented Object Navigation with Graph-based Exploration
2022-11-01 11:26:57
1349
原创 阅读报告2:Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation
阅读报告Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigatio
2022-10-22 18:57:34
2600
原创 Vision-Dialog Navigation和Vision-and-Language Navigation简单总结
Vision-and-Language Navigation的paper list
2022-09-18 20:53:29
1603
原创 解决方式之一Caught AttributeError in replica 0 on device 0.
解决Caught AttributeError in replica 0 on device 0.
2022-08-27 14:50:20
2317
1
原创 第一篇学术论文经验总结(草稿)
第一篇学术论文经验总结(草稿)**前提****写作****摘要****引言**,相关工作,方法,实验及结果,**结论。****改论文,改论文,改论文****科研工具**查文献工具翻译润色前提在写作之前的一些准备工作1阅读大量相关文献(精读10篇以上,泛读20篇以上)2复现别人的实验结果(3-5个以上)3论文写作,可以尝试写一篇综述,质量尽可能好,投不投稿不重要;也可以将日常阅读的文献写入博客或者做成ppt,像写日记一样,将学到的东西都在博客里记录4有创新点,创新点有效。一开始读论文的时候总是能脑
2022-05-20 13:55:29
1099
原创 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.内核版本不匹配
一nvidia-smiNVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.step1:sudo apt-get install dkmsstep2: sudo dkms install -m nvidia -v 440.44再次输入nvidia-smi时,你熟悉的界面
2022-05-16 00:25:33
682
原创 断电断网等原因致使重新进入linux时系统进不去,进不了图形界面,出现/dev/sda2 recovery,clean,,,
断电断网等原因致使重新进入linux时系统进不去,进不了图形界面,出现/dev/sda2 recovery,clean,,,许多方法说是驱动问题,现在看来不是,至少不完全是,我的意思是重装驱动可能能解决问题,但是没必要。进入命令行状态ctrl+alt+f2原因一,某块硬盘占用已经满了查看磁盘占用:df -lh如果是/dev/sda2内存占用过大,则需要进一步查看文件夹无用文件,确定无用后删除即可删除命令:rm -rf 文件路径如果是/dev/loop 满了:sudo apt aut
2022-03-03 11:07:47
3035
1
原创 将本地项目上传到Github(不用代码或命令行,直接拖拽文件夹)
一般github上传文件,一次只能上传一个,而且不能是文件夹我们可以创建2级目录文件,那么一级目录就成了一个文件夹而不是文件了。然后点击上传,拖拽即可。注意,第一次二级目录是创建而不是上传...
2022-03-02 10:30:17
1053
原创 python图像均匀加雾
注意输出的和保存的结果不一样,imshow的可能是全白也可能是全黑,但是imwrite可能是正常的。相反也是import cv2, mathimport numpy as npdef AddHaze1(img): # img_f = img # 保存文件用这行 img_f = img / 255.0 # 对原博主的代码进行了更改,这是显示时的样子 (row, col, chs) = img.shape A = 0.6 # 亮度 be
2022-02-27 19:35:49
4589
3
原创 python打乱字典键对应的值
注意字典和列表的转换参考连接1参考连接2import randompath = 'train_test_ans2label.pkl' # path='/root/……/aus_openface.pkl' pkl文件所在路径f = open(path, 'rb')data = pickle.load(f)print(data)print('----------------------------------------------------------')k = data.ke
2021-09-15 20:39:21
401
原创 pytorch与以安装的cuda版本非必须
pytorch需要 与cuda和python版本匹配,但是cuda11以后就没有python27的pytorch了想要继续使用只需要安装低版本cudatoolkit就行了
2021-09-14 03:31:43
1352
原创 已解决Fatal Python error: init_fs_encoding: failed to get the Python codec of the filesystem encoding
这个是因为环境变量出错了Python path configuration:PYTHONHOME = ‘/home/admin888/miniconda3/bin’PYTHONPATH = ‘KaTeX parse error: Double subscript at position 66: ….9.2-hffdb5ce_0_̲cpython/lib/pyt…PYTHONPATH’,‘/home/admin888/miniconda3/pkgs/python-3.9.2-hffdb5ce_0_cp
2021-09-14 02:56:27
28470
1
转载 StopIteration: Caught StopIteration in replica 0 on device 0.解决
原文来自连接不是第一次遇到了,但是遇到了真不会改,我只用下面两步就好了1.torch报错:StopIteration: Caught StopIteration in replica 0 on device 0.原因:多GPU运行此项目报错,可能是torch版本错误。修改:按照别的博客将 weight = next(self.parameters()).data改为weight = torch.float322.仍报错:AttributeError: ‘torch.dtype’ no attrib
2021-09-14 02:12:09
3458
1
原创 linux卸载重新安装cuda,cudnn和pytorch的误区和相关常用命令
因为是卸载重装,所以假设本文读者之前安装过。有不明白的欢迎交流。有用链接这个链接给了安装过程中的截图,而本文主要是命令行。ubuntu 20.04 安装与卸载 Anaconda3 + CUDA 11.1 + cuDNN 8.0.5 + PyTorch 1.9.0_m0_52650517的博客-CSDN博客查看Ubuntu版本lsb_release -a查看cuda driver和gpu驱动状态版本nvidia-smi查看cuda runtim版本 (runtim<=driver).
2021-09-13 09:15:01
8304
原创 如何快速在两个服务器之间传送大文件
通常连接服务器的方法是使用xftp等软件进行连接,并传送文件。但是,在本地使用xftp连接,需要经过自己的电脑网络转换,速度只有几M,传输大文件非常慢。使用以下命令,直接使用命令,让服务器a直接传输文件给目标服务器b,速度可达百兆。此行代码在服务器a运行scp -r /home/apaper2/data/coco admin10101@000.000.00.00:/home/datascp -r 要传输的文件位置 目标服务器用户名@目标服务器域名:目标服务器位置注意看右下角传输速度...
2021-09-08 11:23:02
6909
1
原创 论文阅读Check it again:Progressive Visual Question Answering via Visual Entailment
论文:Check it again:Progressive Visual Question Answering via Visual Entailment代码:https://github.com/PhoebusSi/SAR本文特点:处理语言先验,vqa-cp v2准确率66.73%,框架通用,基于暗示程度对最可能的几个答案重新排序一,介绍本文认为,最近开发的几种解决语言先验问题的方法,大多数是根据一个最好的输出来预测答案,不考虑答案的真实性,只探索图像与问题之间的相互作用,不考虑答案的语义。如图所
2021-09-06 10:33:35
677
2
原创 多个json对象的json文件比较,并打印区别。
为了分析两个数据集预测值的差别,需要打印具有多个json对象的差别。两个json文件内容大致如下图所示:两个jison文件的question_id一样,每个id对应的answer可能不同。具体实现代码:import json as jsimport difflibimport sysf = open('data/css+v.json', encoding='UTF-8')m = open('data/css.json', encoding='UTF-8')x = js.load(f)
2021-05-10 10:10:29
669
原创 目前绝大多数处理语言先验性文章总结
搬运自github(https://github.com/cdancette/vqa-cp-leaderboard#cl),如有侵权,联系立删!增加了两篇文章:1.Overcoming Language Priors in VQA via Decomposed Linguistic Representations——(AAAI2020)2.Overcoming Language Priors with Self-supervised Learning for Visual Question Answe.
2021-03-19 22:05:11
1229
2
原创 中文核心期刊目录汇总(2020年12月发布)
http://www.jdyy.cn/index.php/tsda/news/id/11523.html不断更新
2021-03-16 20:09:27
4336
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人