前行居士-CSDN博客

原创 HQDec：基于高质量解码器的自监督单目深度估计-2024-TCSVT（中科院一区TOP，2024 IF=8.4）

42]利用3D填充块来保留重要的空间细节，但忽略了多层信息交换的好处。第三，为了获得视差值，目前大多数方法[25]-[28]，[30],[31],[38],[40],[42],[55]，[56]直接使用局部二维卷积，然后使用sigmoid函数将解码器输出的特征映射回归到视差值；最后，为了解决自监督单眼方法[25][28]，[30],[40]，[57]中固有的尺度模糊问题，我们提出了一种自适应尺度对齐策略，通过考虑中值和平均值信息，将获得的估计结果缩放到用光探测和测距（LiDAR）测量的真实情况。

2023-10-10 20:18:36 9184 1

原创 CbwLoss：高效解决动态场景下以及弱纹理下单目深度估计问题(2023-TITS，中科院一区TOP，2023 IF=9.551)

为了解决这些问题，在本文中，我们分别利用流场之间的差异，以及仿射变换和视图合成产生的深度结构之间的差异来处理运动物体和遮挡。其次，我们通过测量具有更多语义和上下文信息的特征之间的差异来减轻无纹理区域对模型优化的影响，而不需要额外的网络。大量的实验和可视化分析证明了所提出方法的有效性，在相同的条件下，该方法优于现有的最先进的自监督方法，并且不引入额外的辅助信息。然后，我们根据一致性检查计算掩模，并使用这些掩模对光度损失进行加权，以减少相应区域的贡献，从而满足基于静态场景的图像重建的基本假设。

2023-09-10 23:29:44 9482 1

原创 ubuntu下实时检测机械硬盘和固态硬盘温度

本文介绍了如何在Linux系统中使用smartmontools工具监控硬盘温度。首先，通过sudo apt update和sudo apt install smartmontools命令安装工具。接着，使用sudo smartctl -a /dev/sda查看硬盘详细信息，包括温度。虽然smartctl无法实时显示温度，但可以通过watch命令定期查看，如watch -n 10 "sudo smartctl -a /dev/sda | grep Temperature_Celsius"，

2025-05-20 21:57:39 629

原创 conda 安装cudnn

搜索并安装 cuDNN：使用以下命令搜索可用的 cuDNN 版本，并安装适合你 CUDA 版本的 cuDNN。添加 Conda 通道：为了通过 Conda 安装 cuDNN，你需要添加 NVIDIA 的 Conda 通道。如果没有安装 CUDA，你需要先从 NVIDIA CUDA Toolkit 下载并安装。通过 Conda 安装 cuDNN。

2025-05-06 22:01:15 458

原创解决Could not load dynamic library ‘libcudart.so.10.1‘； dlerror: libcudart.so.10.1: cannot open shared

【代码】解决Could not load dynamic library 'libcudart.so.10.1';

2025-05-06 21:54:16 136

原创解决报错：AttributeError: module ‘urllib‘ has no attribute ‘urlretrieve‘

在 Python 3.x 版本中，urllib 模块的 urlretrieve 函数已经被废弃，并在 Python 3.3 版本之后从标准库中移除。取而代之的是 urllib.request 模块，其中提供了 urlretrieve 函数的功能。你可以使用 urllib.request.urlretrieve 来实现相同的功能。如何使用 urllib.request 替代 urllib.urlretrieve。

2025-04-20 11:16:56 147

原创解决报错TypeError: load_all() missing 1 required positional argument: ‘Loader‘

YAML 5.1版本后弃用了yaml.load(file)这个用法，因为觉得很不安全，5.1版本之后就修改了需要指定Loader，通过默认加载器（FullLoader）禁止执行任意函数，该load函数也变得更加安全。用以下三种方式都可以。

2025-04-20 11:02:21 489

原创解决requests.exceptions.ChunkedEncodingError: (‘Connection broken: IncompleteRead

这段代码中，首先我们发送了一个GET请求到指定的URL，然后检查响应的header中是否包含’x-content-type-options’字段。最后，我们使用assert语句来验证是否成功设置了’x-content-type-options’字段的值为’nosniff’。然而，根据我的观察，当我使用requests 2.20.0版本发送请求时，响应的header中没有包含’x-content-type-options’字段，这可能会导致潜在的安全问题。

2025-04-11 16:13:48 421

原创解决windows下删除文件提示该项目不存在

将该文本文件另存为 xxx.bat。

2025-04-06 19:35:31 332

原创 windows系统下查看cpu的序列号

CPU序列号是独一无二的标识符，具有终身不变的特性。由于CPU外在的所有标记都可以人为改动，而序列号是内置于CPU内部的，因此只能通过软件读取。利用这个原理，CPU ID工具可以显示出CPU的确切信息，包括移动版本、主频、外频、二级缓存等关键信息，从而查出超频的CPU。此外，序列号还可以用于验证盒装CPU的真伪，确保购买的产品是原装的。以管理员身份运行 cmd。

2025-03-28 16:33:29 1450

原创 RuntimeError: view size is not compatible with input tensor‘s size and stride (at least one dimensio

view操作要求tensor的内存连续存储，所以在view前面需要先使用contiguous()xx.view(-1) 改为 xx.contiguous().view(-1)

2025-03-15 19:56:18 235

原创如何使用HF-Mirror 快速从hf-mirror.com下载数据

huggingface 工具链会获取HF_ENDPOINT环境变量来确定下载文件所用的网址，所以可以使用通过设置变量来解决。可以添加 --local-dir-use-symlinks False 参数禁用文件软链接，这样下载路径下所见即所得，详细解释请见上面提到的教程。hfd 是本站开发的 huggingface 专用下载工具，基于成熟工具 aria2，可以做到稳定高速下载不断线。huggingface-cli 是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。方法三：使用 hfd。

2025-03-15 10:30:33 1012

原创 CbwLoss Constrained Bidirectional Weighted Loss for Self-Supervised Learning of Depth-TITS-1区TOP

为了解决这些问题，在本文中，我们分别利用流场之间的差异，以及仿射变换和视图合成产生的深度结构之间的差异来处理运动物体和遮挡。其次，我们通过测量具有更多语义和上下文信息的特征之间的差异来减轻无纹理区域对模型优化的影响，而不需要额外的网络。大量的实验和可视化分析证明了所提出方法的有效性，在相同的条件下，该方法优于现有的最先进的自监督方法，并且不引入额外的辅助信息。然后，我们根据一致性检查计算掩模，并使用这些掩模对光度损失进行加权，以减少相应区域的贡献，从而满足基于静态场景的图像重建的基本假设。

2025-03-14 22:54:19 1030

原创 HQDec: Self-Supervised Monocular Depth Estimation Based on a High--2024-TCSVT（中科院一区TOP，2024 IF=8.4）

42]利用3D填充块来保留重要的空间细节，但忽略了多层信息交换的好处。第三，为了获得视差值，目前大多数方法[25]-[28]，[30],[31],[38],[40],[42],[55]，[56]直接使用局部二维卷积，然后使用sigmoid函数将解码器输出的特征映射回归到视差值；最后，为了解决自监督单眼方法[25][28]，[30],[40]，[57]中固有的尺度模糊问题，我们提出了一种自适应尺度对齐策略，通过考虑中值和平均值信息，将获得的估计结果缩放到用光探测和测距（LiDAR）测量的真实情况。

2025-03-14 22:50:56 796

原创 AAAI2025 Accepted Papers（十一）

AAAI2025 Accepted Papers

2025-03-14 22:10:11 572

原创 AAAI2025 Accepted Papers（十）

AAAI2025 Accepted Papers

2025-03-14 22:07:57 674

原创 AAAI2025 Accepted Papers（九）

AAAI2025 Accepted Papers

2025-03-14 22:06:35 1382

原创 AAAI2025 Accepted Papers（八）

AAAI2025 Accepted Papers

2025-03-14 22:00:45 993

原创 AAAI2025 Accepted Papers（七）

AAAI2025 accepted papers

2025-03-14 21:52:51 994

原创 AAAI2025 Accepted Papers（六）

AAAI2025 accepted papers

2025-03-14 21:49:26 1037

原创 AAAI2025 Accepted Papers（五）

AAAI2025 accepted papers

2025-03-14 21:38:01 1909

原创 AAAI2025 Accepted Papers（四）

AAAI2025 accepted papers

2025-03-14 21:31:50 1341

原创 AAAI2025 Accepted Papers（三）

AAAI2025 accepted papers

2025-03-14 21:17:44 1127

原创 AAAI2025 Accepted Papers（二）

AAAI 2025 accepted papers

2025-03-14 21:09:57 861

原创 AAAI2025 Accepted Papers（一）

AAAI 2025 Accepted Papers

2025-03-14 20:35:13 1281

原创 CVPR2025 Accepted Papers

bo zhou · Liulei Li · Yujia Wang · 刘华峰 Liu · Yazhou Yao · Wenguan Wang。Haijin Zeng · 湘铭王 · Yongyong Chen · Jingyong Su · Jie Liu。

2025-03-11 16:43:47 3040

原创解决报错ImportError: cannot import name ‘compare_ssim‘ from ‘skimage.measure‘

新的版本已经将ssim放到了structural_similarity。skimage的版本如上图所示，导入ssim 出现如下报错。

2024-12-11 15:48:20 599

原创自编码器（三）去噪自编码器

在讲BERT的技术的时候，我们说这个输出就叫做嵌入，接下来有一个线性的模型，就是解码器，解码器要做的事情，就是还原原来的句子，也就是把填空题被盖住的地方，把它还原回来，所以我们可以说， BERT 其实就是一个去噪的自编码器。或者换一个说法，如图1.2所示，这个BERT它有12层，最小的那个BERT有12层，比较大的有24层或者是48层，那最小的BERT是12层，如果我们说这个12层中间，第6层的输出是嵌入，那其实也可以说剩下的6层，就是解码器。图1.1 去噪自编码器的结构。

2024-11-30 00:21:09 583

原创自编码器(二）

一般在训练的时候就会看到这种状况，就是因为图片的变化还是有限的。因此我们在做编码器的时候，有时只用两个维度就可以描述一张图片，虽然图片是3×3，应该用9个数值才能够储存，但是实际上它的变化也许只有两种类型，那你就可以说看到这种类型，我就左边这个维度是1，右边是0，看到这种类型就左边这个维度是0，右边这个维度是1。如果我们可以把复杂的图片，用比较简单的方法来表示它，那我们就只需要比较少的训练数据，在下游的任务里面，我们可能就只需要比较少的训练数据，就可以让机器学到，这就是自编码器的概念。

2024-11-30 00:15:56 541

原创自编码器（一）

那这边编码器和解码器，也就是这个自编码器的概念，跟CycleGAN其实是一模一样的，都是希望所有的图片经过两次转换以后，要跟原来的输出越接近越好，而这个训练的过程，完全不需要任何的标注数据，你只需要收集到大量的图片，你就可以做这个训练。这个都是见仁见智的问题，这种名词定义的问题，我们就不用太纠结在这个地方，从自监督学习，即不需要用标注数据来训练这个角度来看，自编码器我们可以认为它算是自监督学习中的一种方法，它就跟填空或者预测接下来的词元是很类似的概念，只是用的是另外一种不一样的思路。

2024-11-30 00:11:19 883

原创深度模型训练优化

图2(a) 横轴指的是训练的过程，就是参数更新的过程，随着参数的更新，损失会越来越低，但是结果 20 层的损失比较低，56层的损失还比较高。残差网络是比较早期的论文，2015年的论文。在训练集上，20层的网络损失其实是比较低的，56层的网络损失是比较高的，如图2(b)所示，这代表56层的网络的优化没有做好，它的优化不给力。以第一章的预测未来观看人数为例，可以增加输入的特征，本来输入的特征只有前一天的信息，假设要预测接下来的观看人数，用前一天的信息不够多，用56天前的信息，模型的灵活性就比较大了。

2024-11-09 11:01:03 775

原创 ubuntu客户端将服务器Ubuntu主机下的硬盘映射到本地

安装 sshfssudo apt install sshfssshfs 远程主机用户名:远程目录本地目录（需要先创建）

2024-10-11 21:48:36 211

原创将ppa.launchpad.net换成中科大源

将文件中http://ppa.launchpad.net替换为https://launchpad.proxy.ustclug.org，如下所示:

2024-09-30 21:14:12 363

原创可解释性机器学习中的局部解释

可解释性机器学习可以被分成两大类，第一大类叫做局部的解释，第二大类叫做全局的解释，如图 1 所示。局部的解释是，比如有一个图像分类器，输入一张图片，它会判断出是一只猫，机器要回答问题是为什么它觉得这张图片是一只猫。根据某一张图片来回答问题，这个叫做局部的解释。还有另外一类，称为全局解释。其指还没有给分类器任何图片，而直接问对一个分类器而言，什么样的图片叫做猫。我们并不是针对任何一张特定的图片来进行分析，我们是想要知道有一个模型它里面有一些参数的时候，对这些参数而言什么样的东西叫作

2024-09-15 16:03:09 1243

原创可解释性机器学习的目标

这个实验是这样，在哈佛大学图书馆的打印机经常会有很多人都排队要印东西，这个时候如果有一个人跟他前面的人说拜托请让我先印5页，这个时候你觉得这个人会答应吗？但这个时候你只要把刚才问话的方法稍微改一下，你说拜托请让我先印，因为我赶时间，他是不是真的赶时间没人知道，但是当你说你有一个理由所以你要先印的时候，这个时候接受的程度变成94%。神奇的事情是，就算你的理由稍微改一下，比如说请让我先印因为我需要先印，仅仅是这个样子接受的程度也变成93%。我们要了解模型的一切，我们要知道它到底是怎么做出一个决断的。

2024-09-12 08:12:24 494

原创决策树模型的可解释性

其实不是的，它是一个树状的结构，那我们可以想像一下，如果特征非常地多，得到决策树就会非常地复杂，就很难去解释它了。所以复杂的决策树也有可能是一个黑盒子，它也有可能是一个非常地复杂的模型，所以我们也不能够一味地去使用决策树。很多同学都会说，这个打Kaggle 比赛的时候，深度学习不是最好用的，决策树才是最好用的，决策树才是Kaggle比赛的常胜将军。一棵决策树可以凭借着每一个节点的问题和答案知道它是怎么做出最终的判断的，但当你有一片森林的时候，你就很难知道说这一片森林是怎么做出最终的判断的。

2024-09-11 23:31:58 415

原创可解释性人工智能（eXplainable Artificial Intelligence，XAI）

举例来说，假设我们都采用线性模型，它的解释的能力是比较强的，我们可以轻易地知道根据一个线性模型里面的每一个特征的权重，知道线性的模型在做什么事。机器学习未来也会被用在医疗诊断上，但医疗诊断是人命关天的事情，如果机器学习的模型只是一个黑箱，不会给出诊断的理由的话，那我们又要怎么相信它做出的是正确的判断呢。现在也有人想把机器学习的模型用在法律上，比如说帮助法官判案，比如一个犯人能不能够被假释，但是我们怎么知道机器学习的模型它是公正的呢，它是不是有种族歧视的问题呢。旁边的人就会欢呼，给它胡萝卜吃。

2024-09-11 23:24:35 662

原创终身学习的主要解法

对于这种方式，基本的思想就是每一个参数对我们过去学过的任务的重要性程度是不同的，因此在学习新的任务时，我们尽量不要动那些对过去任务很重要的参数，而是去学一些其他的对新任务比较重要的参数。其实有一种简单的控制变量的方法，就是移动或改变某个参数，如图2所示，我们移动θb 1 时会发现在一定范围内损失值都是很小的，即接近最优的参数，那么我们就可以认为这个参数在一定范围可变，相应的重要性参数b1就可以很小，即这个参数对旧任务来说不是很重要，反之像θb 2 这种不能随意移动的参数对应的重要性参数就必须很大。

2024-09-11 23:21:37 932

原创终身学习之评估方法

如图1 所示，任务一就是常规的手写数字识别，任务二其实还是手写数字识别，但只是把每一个数字用某一种特定的规则打乱，称之为排列，这种算是比较难的，还有更简单的就是把数字右转一次。具体的评估方式如图2所示，首先有一排任务，并且有一个随机初始化的参数，用在这T 个任务上，得到对应的准确率。然后让模型先学第一个任务，然后在所有任务上分别测一次准确率，即R1,1,...,R1,T，依此类推。直到学完所有的任务，得到一个准确率的表格，来评估终身学习的结果。图1 评估终身学习的准确率表格。

2024-09-10 23:28:05 288

原创终身学习（LifeLong Learning，LLL）

我们先训一个比较简单的网络来做第一个手写数字识别任务，然后再做任务二，任务一上的准确率是90%，此时就算没有训过任务二，在任务二上也已经有了96%的准确率，可以说迁移得非常好，说明能够解决任务一，相应地也能解决任务二。但其实这种多任务学习会有这样一个问题，加上我们需要学习的任务不再是简简单单的二十个，而是一千个，那么我们在学第一千个任务的时候，按照这个逻辑还得把前面九百九十九个任务的数据放在一起训练，这样需要的时间是比较久的。而且随着要学习的任务越来越多，所需要的训练时间也会越来越长。

2024-09-10 23:22:09 1671

空空如也

空空如也