自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 docker 配置与使用

sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg gpg: WARNING: unsafe ownership on homedir '/home/hxy/.gnupg' File '/usr/share/keyrings/docker-archive-keyring.gpg' exists. 是否覆盖?没有可用的软件包 docker-ce,但是它被其它的软件包引用了。3.添加Docker的官方GPG密钥。

2024-06-20 09:59:50 1441 1

原创 全局特征提取netvlad的理解

2024-06-17 22:08:02 289

原创 转置卷积和普通卷积

转置卷积和普通卷积有相同的本质: 建立了一些值之间的关系. 只不过,转置卷积所建立的这个关系与普通卷积所建立的关系,方向相反.我们可以使用转置卷积来进行上采样. 并且,转置卷积中的权重是可以被学习的. 因此,我们没有必要搞什么插值方法来做上采样.尽管它被称作转置卷积, 但是这并不意味着我们是拿一个已有的卷积矩阵的转置来作为权重矩阵的来进行转置卷积操作的. 和普通卷积相比,intput和output的关系被反向处理(转置卷积是1对多,而不是普通的多对1),才是转置卷积的本质.

2024-06-01 14:04:28 558

原创 局部特征描述子和全局特征描述子

在实际应用中,常常将全局描述符和局部描述符结合使用,以发挥各自的优点。例如,可以先用全局描述符进行粗筛选,再用局部描述符进行精匹配,从而在保证检索速度的同时提高检索的准确性和鲁棒性。

2024-06-01 11:19:52 353

原创 相对位姿估计

P的位置PXYZT相机内参k1​相机内参k2​p1​和p2​s1​p1​K1​Ps2​p2​K2​RPt**公式二:**归一化平面上的坐标x1​K1−1​p1​x2​K2−1​p2x2​Rx1​ttx2​tRx1​x2T​tx2​x2T​tRx1​x2T​tRx1​0K2−1​p2​TtRK1。

2024-05-29 17:20:29 987

原创 如何将归一化模块和别的模块写在一起

PreNorm(dim, FeedForward(dim=dim))# LN + 前馈网络。类实现了一个前馈神经网络,它包含了三个卷积层和两个 GELU 激活函数。这个模块先对输入进行LayerNorm归一化,然后再应用传入的函数。它可以被用作其他模块(例如前馈网络)之前的归一化步骤。

2024-05-21 15:44:42 134

原创 在深度学习中常见的初始化操作

用于计算正态分布从负无穷大到给定值 xxx 的概率。

2024-05-20 10:41:40 740

原创 对注意力机制和多头注意力机制的理解

在多头注意力机制中,每个注意力头独立进行查询、键、值向量的计算和交互。每个头只处理其对应的q_ik_iv_i,然后将所有头的输出拼接在一起,形成最终的输出。通过这种方式,模型能够在不同的注意力头中捕捉到不同的上下文信息,增强表示能力。的作用是将原始的注意力权重矩阵转换为概率分布,从而确保每个查询位置的注意力权重总和为 1。这种归一化操作使得注意力机制可以对不同的键值位置进行合理的加权求和,从而更好地反映每个位置的重要性和相关性。

2024-05-18 22:36:01 664

原创 ubuntu查看文件夹占存储空间大小

3、输入一下命令,并将待查看的文件夹路径替换为实际路径。2、输入以下命令安装ncdu。

2024-05-16 19:21:51 127

原创 在使用pytorch训练时,没有找到cudnn引擎的问题

【代码】在使用pytorch训练时,没有找到cudnn引擎的问题。

2024-04-29 15:19:04 139

原创 Batch Normalization、Layer Normalization、group Normalization之间的区别

对于batch normalization而言,针对输入的所有样本,进行求均值和方差,之后对每一个样本进行均值和方差的求解。避免每一层归一化后都相同,通过。四个,系数矩阵w,偏置b,线性变换的系数γ和β,但是在归一化过程中,需要减掉均值,因此偏置b不需要学习,因此需要学习的参数总共有3个。在每一层网络中使用BN归一化,我们可以保证每一层运算的结果都是相似的,之后可以使用较大的学习率,参数初始化不敏感,加快网络训练。每一层神经元包含三种运算,分布归一化和非线性激活的顺序可以变换。进行简单的线性变化。

2024-04-15 19:31:41 287

原创 mamba笔记

在 S4 中,我们的离散参数是常数,但 Mamba 会根据输入使这些参数发生变化。

2024-03-30 22:19:00 1173

原创 如何给srs配置https协议,并通过nginx转发请求访问到srs

nginx服务器(公网暴露访问,挂域名)SRS服务器(内网IP访问,也可公网IP访问,无域名)

2024-03-12 21:39:16 1707

原创 开机自启动nginx、redis、srs

第三步:更新apt-get,在终端输入第四步:完成更新后,重新安装sysv-rc-conf,在终端输入,即可成功安装。第五步:启动sysv-rc-conf,

2024-03-12 20:50:40 1021

原创 矩阵特征值和奇异值之间的关系

而对于一个非方阵的矩阵,它的奇异值则是矩阵的秩和特征向量的相对缩放因子。奇异值分解(SVD)可以将矩阵分解为三个部分:U、Σ 和 V^T,其中 U 和 V 是正交矩阵,Σ 是一个对角矩阵,对角线上的元素就是矩阵的奇异值。需要注意的是,特征值和奇异值所描述的信息不完全相同,特征值更多地描述了矩阵在特定方向上的缩放,而奇异值则更多地描述了矩阵整体的缩放和旋转。对于一个方阵,其特征值是该矩阵在空间中的特殊向量方向上的缩放因子。矩阵的特征值和奇异值是线性代数中重要的概念,它们之间存在一定的关系。

2024-03-07 10:29:37 2282

原创 pytorch——数据加载

是用于加载数据集的类。它可以处理数据的批量加载、数据随机洗牌、多进程数据加载等操作。通过将数据集和数据加载器结合使用,你可以有效地迭代整个数据集,并将数据提供给模型进行训练。模块,你可以更轻松地处理和加载数据,尤其是在深度学习任务中,它可以帮助你构建数据管道,使数据在训练过程中流畅地传递给模型。是 PyTorch 提供的一个模块,用于构建和操作数据加载和处理管道。这个模块包含了一些重要的类和函数,用于创建自定义数据集、数据加载器以及数据预处理。也提供了一些数据预处理函数,用于在数据加载时进行转换。

2023-10-14 12:37:03 166 1

原创 “Embedding“(嵌入)在不同层次的理解

"Embedding"(嵌入)是在计算机科学和机器学习领域中经常使用的术语,通常用来表示将高维数据映射到低维空间的过程或结果。

2023-10-08 10:45:26 511 1

原创 transformer与注意力机制之间的关系

Transformer 和注意力机制(Attention Mechanism)之间存在密切的关系,事实上,注意力机制是 Transformer 模型的核心组成部分之一。注意力机制Transformer 模型中的自注意力机制是其关键组成部分,它允许模型在输入序列中动态地关注不同位置的信息。注意力机制为 Transformer 提供了处理序列数据的强大工具,使得 Transformer 在自然语言处理、图像处理等领域取得了显著的成就,并成为了深度学习中的一个重要突破。

2023-10-08 10:24:55 1423 1

原创 帧级别特征和视频级别特征

帧级别特征和视频级别特征是两种不同级别的特征提取方法,它们的主要区别在于提取的时间尺度和信息的粒度。帧级别特征:时间尺度:帧级别特征是针对视频中的每一帧(图像)而言的,它在每一帧上提取特征。每一帧都被视为独立的输入数据。信息粒度:帧级别特征通常捕获了关于每一帧的细节信息,例如颜色、纹理、形状等。这些特征可以用于帧级别的任务,如图像分类、目标检测等。应用:帧级别特征常用于需要考虑每一帧的任务,例如视频帧的分类、物体检测、图像处理等。每一帧都被单独处理,不考虑帧与帧之间的时间关系。视频级别特征。

2023-10-08 09:56:02 246 1

原创 梯度消失和梯度爆炸

在深度神经网络中,反向传播算法用于计算梯度以更新网络参数。梯度是损失函数相对于网络参数的变化率。梯度消失指的是在网络的深层结构中,梯度值逐渐减小到接近零的情况。当梯度消失发生时,网络在训练过程中不能有效地学习权重,导致网络无法收敛到合适的解决方案。这个问题通常出现在使用某些激活函数(如 Sigmoid 或 Tanh)和深度较大的网络中。

2023-10-07 19:26:04 44 1

原创 soft assignment 和 hard assignment

"Soft assignment" 和 "hard assignment" 是在聚类和分类任务中常用的两种不同的分配方式,它们决定了数据点属于哪个类别或簇的方式。中,每张图像可以以一定的概率同时属于多个类别。软分配可以更好地处理复杂的数据情况,其中一个数据点可能不完全属于一个类别,或者可能属于多个相关类别。中,每张图像只能属于一个类别(例如,猫或狗),考虑一个图像分类任务。

2023-10-07 15:58:41 496 1

原创 电脑u盘启动快捷键

电脑名称 快捷键 联想台式电脑 F12 惠普台式电脑 F12 宏基台式电脑 F12 戴尔台式电脑 ESC 神舟台式电脑 F12 华硕台式电脑 F8 方正台式电脑 F12 清华同方台式电脑 F12 海尔台式电脑 F12 明基台式电脑 F8 联想笔记本 F12 宏基笔记本 F12 外星人笔记本 F12 小米笔记本 F12 华硕笔记本 ESC 惠普笔记本

2023-07-30 23:28:26 124 1

原创 ubuntu18.04双系统配置linux内核、nvidia、cuda、cudnn

版本时,可以通过外接一个显示器使用,而笔记本电脑自己的屏幕是卡死在登陆界面的,这块儿不太懂,也没有解决,有解决的uu可以私信,一起交流呀!在安装完各种版本的nvidia显卡驱动后,均卡死在登陆界面(循环登陆问题),在这个内核版本中,根本无法解决循环登陆问题。ubuntu默认使用的gnome管理器是gdm3,可以安装sudo apt-get install lightdm。版本时,可以正常使用,但一开始还是会出现循环登陆问题,此处的。默认配置:save --> load --> exit。

2023-07-28 12:24:11 2724 1

原创 主成分分析(PCA)

数据降维的算法!引子。

2023-06-06 10:58:06 124

原创 奇异值分解(SVD)

特点:变换的矩阵是对角阵!旋转特点:变换的矩阵是正交矩阵!注意:如果矩阵是一个正交矩阵(AxA^T=E),那么其内部蕴含的几何意义是旋转;如果矩阵是一个对角矩阵,那么其内部蕴含的几何意义是拉伸!实质:先进行旋转-->再进行拉伸-->最后再进行旋转回来!物理意义物理意义:在变换前找到一组正交基V,目的是找到变换之后的正交基U!SVD推广到任意大小矩阵注意:这五个奇异值代表的是五个基,且基的重要程度从上往下依次降低!注意:这里是去掉不重要的特征值!

2023-06-06 09:40:15 95 1

原创 SLAM十四讲——第六讲非线性最小二乘问题

思想:使用一阶展开的平方产生二阶项,从而避免求FX的海森矩阵。2、加多少 or 减多少。初值选择对于非凸优化的问题的求解结果十分重要【ICP、Pnp,连续运动假设】求逆是维度三次方复杂度操作,可以通过矩阵分解的方式简化【矩阵分析 矩阵论】“人为地”定义了利用信赖域来选择增量大小。也是一种操作信赖域方法。1、各个维度加还是减。

2023-06-04 17:21:17 158 1

原创 SLAM十四讲——第六讲矩阵求导

例子。

2023-06-04 15:11:32 118 1

原创 SLAM十四讲——第四讲李群李代数实机操作

将依赖 libglew*-dev换成 libglew-dev。将依赖 libpng12-dev换成libpng-dev。// 沿Z轴转90度的旋转矩阵。

2023-06-04 09:51:38 31 1

原创 SLAM十四讲第六讲——优化问题

说白了,就是保留原问题部分性质的条件下,使用简单的项替代目标函数中难以处理的项,进而使得问题更易求解。3、常见的处理思路,是借助松弛的思想,将非凸问题转化为近似凸问题。此时需要清楚原非凸问题中的哪个或哪些函数导致了非凸性,之后考虑的是如何利用凸优化模型来逼近原问题。代码开源,用于解决非线性最小二乘问题,特定是将优化中涉及的对象用图(graph)的形式来表示。2、判断问题是凸的还是非凸的,同样也是一门学问。2、不等式约束是凸的。3、所在的空间是凸的。思路清晰,讲凸优化理论问题、光滑、非光滑、结构优化。

2023-06-04 09:49:55 419 1

原创 SLAM十四讲——第五讲相机与图像实践部分

对图像进行一些处理,如对图像进行裁剪、旋转、像素值的归一化,去噪,加噪声、像素统计学、读取视频。

2023-05-28 21:36:24 73

原创 SLAM十四讲——第五讲相机与图像理论部分

目录相机模型单目模型(重点) 单目针孔模型 相机畸变: 相机畸变处理流程如下: 成像过程总结 :鱼眼相机 卷帘相机与全局相机全景相机(使机器人感知360°的环境)双目针孔模型(重点)双目相机:存在问题:RGB-D与双目相机估计深度的区别优点:缺点:相机标定(重点)为什么要标定常用标定方法matlabOpencvKalibr(ROS)GitHub - ethz-asl/kalibr: The Kalibr visual-inertial calibration t

2023-05-27 20:26:30 355 1

原创 常用markdown语法和typora快捷键

常用markdown语法和typora快捷键

2023-05-27 15:15:23 96 1

原创 slam第三讲 三维空间刚体运动环境配置

slam14讲第三讲的一些笔记

2023-05-26 22:21:18 122 1

原创 ubuntu常见操作

让用户临时挂载别的文件系统。

2023-05-26 13:53:02 112 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除