自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 问答 (1)
  • 收藏
  • 关注

原创 Windows环境下安装docker、配置Ubuntu容器并使用vscode ssh连接到容器

在vscode中shfit+ctrl+p,输入。,打开config,配置ssh文件。配置完成后,就点击+可以连接啦~~并查看ssh服务是否启动。

2024-07-26 16:46:19 498

原创 目标检测--X-anylabeling使用自己的模型自动标注

x-anylabeling安装教程——

2024-07-15 16:16:51 1105 2

原创 农业采摘--RGBD数据转point cloud

将RGBD图像转点云数据常包含五个步骤:**1. 图像采集:**使用RGBD相机同时捕获颜色(RGB)和深度(Depth)信息。颜色记录了场景的彩色视觉信息,而深度图像记录了场景中每个像素点到相机的距离。**2. 获取相机内参:**相机内参是一组参数,描述了图像像素坐标到相机坐标系坐标中点的映射关系。它通常包含焦距(fx, fy)和光学中心(cx, cy)等参数,定义了一个3x3的矩阵。这些参数用于将2D图像坐标转换为3D相机坐标。

2024-07-10 16:55:11 411

原创 Yolo系列——动态卷积

动态卷积的基本思路是根据输入数据,自适应地的调整卷积参数。即做采用的卷积核与输入相关,不同的输入有着不同的卷积核。

2024-07-05 17:29:45 1059

原创 Transformer2--Multi-head self-attention

为什么是multi-head self attention?**并行的处理多种注意力模式:**每个注意力头使用不同的线性变换,这意味着它们可以从输入序列的不同子空间中学习不同的特征关联。这样一来,模型可以通过多个注意力头同时关注输入序列的不同方面,如一句话的语法结构、语义角色、主题转移等。**增加模型的学习能力和表达能力:**通过多个注意力头,由于每个头关注的特征不同,模型可以学习到更丰富的上下文信息,这样综合起来可以更加全面的理解和处理序列。

2024-06-26 11:40:20 1035

原创 YOLO系列--Anchor Based & Anchor Free

Anchor也被称为锚框,预先设置目标的大概位置,然后再在这些预设框的基础上进行精细化的调整。调整过程被包括分类判断预设框是属于正样本+ or 负样本-和回归调整预测框的位置。

2024-06-23 17:04:45 1333

原创 Transformer1--self attention

找出任意两个输入的相关性。

2024-06-21 11:16:29 674

转载 Mamba 4 --并行扫描

即便有很多可用的处理器,在任何一次处理中,只有等到前面所有步骤完成,才能处理下一个任务。而卷积层在处理任务的时候只需要查看原始输入,只要有足够的可用处理器,就可以同时在所有输入上并行计算。直到去年发表的一篇论文表面线性RNN可以避免这两个问题,因此线性RNN是高效的长序列模型。S5是基于S4的设计基础,S4层使用许多独立的单输入、单输出SSM,而S5使用一个多数人、多输出的SSM。从理论上来讲,单个循环层可以不断地提炼任意长的信息输入,但实际上却不然,最多只学习和提炼最近的数十个输入信息。

2024-06-20 22:53:30 125

原创 Mamaba3--RNN、状态方程、勒让德多项式

RNN本质上是一个SSMS4将序列信号映射至勒让德基函数空间,状态向量即为多项式系数S4中将RNN中权重矩阵W替换成Hippo矩阵。

2024-06-19 22:31:15 894

转载 Mamba2-状态、状态空间、状态空间方程

一个用n阶微分方程描述的系统,就有n个独立变量,求的这n个独立变量的时间相应,系统的运动状态也就被揭示无疑了。状态方程和输出方程一同构建一个动态系统的完整描述,称为系统的状态空间表达式,也称为状态空间描述。同一个系统,究竟选取的哪些变量可以作为状态变量,这不是唯一的,要紧的这些变量是相互独立的,其个数等于微分方程的阶数。通过构建状态向量,将实际带有物理意义的状态变量转化为n空间的一个坐标,便于观察状态变量随时间变化的规律。动态系统的状态说明粗略的说是指系统的过去、现在和将来的动态变换情况。

2024-06-19 15:45:56 108

转载 Mamba1-RNN

RNN用于处理序列数据。在传统的神经网络模型中,是从输入层到隐藏层再到输出层,层与层之间是全连接的,每层之间的节点是全连接的,层内的节点是无连接的。但是这种普通的神经网络对于很多问题却是无能为力。例如,你要预测下一个单词是什么,一般需要考虑前面输入的上下文信息。RNN之所以称为循环神经网络,具体表现为网络会对前面的信息进行记忆并应用到当前输出的计算中,即隐藏层之间的节点不再是无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输入还包括上一时刻隐藏层的输出。理论上,RNN能够对任意长度的序列数据进行处理。

2024-06-18 17:59:57 51

原创 Linux环境下配置Yolov8训练自己的数据集

但是还是报错,后来才发现是下载权重文件时,.pt文件没有被完整加载,也会报下面这个错误。其次,如果你的数据格式为.png, 但是train.txt、val.txt中写入时写入的是.jpg,数据不能被成功加载时也会报这个错误。在Terminal 执行上面的代码。

2024-06-15 21:26:16 671

原创 目标检测篇--YOLOv5原理篇

SPPF(空间金字塔),首先通过一个标准卷积将输入通道减半,然后分别做kernel-size为5,9,13的maxpooling(对于不同的核大小,padding是自适应的)。由于实际使用的图片很多图片的长宽比例不同,因此在缩放填充后,两端都会有黑边,如果填充过多,则会存在大量信息冗余,从而影响整个算法的推理速度。例如,images大学为608。在网络训练阶段,模型在初始锚点框的基础上输出对应地预测框,计算与GT框之间的差距,并执行反向更新操作,从而更新网络的参数,因此初始点锚框的设置也非常关键。

2024-06-11 11:06:21 2194

原创 Linux代码报错记录

原因:文件夹命名后顺手打了一个空格“ ”类型:文件夹命名问题。报错:cd找不到路径。

2024-05-30 16:34:35 108

原创 扩散模型--论文分享篇

Mask的定义:产生mask:mask掉位置,使用文本描述定位到图像位置,对位置根据文本编辑。基于GAN的图像生成,一个生成器与判别器直接的对抗过程,使得生成器生成高质量的数据。VAE:将数据映射至特征空间,(PCA),对特征空间的特征约束为进行服从高斯分布。Morphing:给定两个端点,生成一系列的逐渐的过度过程。所采用的方法:对比学习、基于跨注意力机制的多模态融合。生成模型存在的两个问题:模式崩塌和模型覆盖率低。定义:输入文本与图像,生成对图像的描述。基于扩散模型的方法:主要介绍的扩散的原理。

2024-05-29 17:32:21 411

原创 扩散模型基础

扩散模型(Diffusion Models)发表以来并没有受到过多关注,它不像GAN那样思想简单粗暴好理解。不过最近几年正在生成模型领域异军突起,例如比较火爆的文字生成图像的模型DALL E2和Google的Imagen,都是基于扩散模型来做的。相较于GAN,扩散模型的训练过程不存在博弈过程,损失容易收敛。(GAN由于对抗过程,损失经常出现震荡的情况)相较于VAE:扩散模型需要通过多个高斯分布来描述复杂的图像分布,它的生成图像质量高、多样性好。

2024-05-28 22:24:19 886

原创 机器学习吃瓜--(前两章)

第一章第二章

2022-01-11 22:33:29 370

原创 李宏毅机器学习-P21卷积神经网络

为什么卷积神经网络适用于处理图像整个CNN架构CNN如何学习CNN的应用卷积神经网络用于图像处理:简化Fully connectbetwork(简化节点)目标是一个局部区域,只要找到小范围目标就可以处理图像而不需要观察整幅图像。同样的patterns出现在不同的局部位置,可以共用同一组参数巡训练。CNN中存在subsamplinggu过程3. 整个CNN的架构CNN-Convfiler一般比image要小每个filter中的值都是学习得到的,而不是提前设定的有多少filte.

2021-09-25 21:43:44 235

原创 李宏毅机器学习--P6梯度下降法

Review: gradient DescentLearning rates给优化过程中带来的影响自适应调整learning rate 的方法梯度下降法的背后理论基础Review: gradient Descent在上一个视频里,已经介绍了使用梯度下降法求解Loss functionθ∗=argmin L(θ)\theta^*=argmin\ L(\theta)θ∗=argmin L(θ)L:loss function θ\thetaθ:参数梯度下降过程中的可.

2021-09-17 21:52:39 318

原创 李宏毅机器学习-P5误差来自哪里

偏差和方差估计欠拟合、过拟合与偏差、方差的关系如何解决过拟合问题模型选择前提:第iii个空间下对应一组数据{(x1,y),(x2,y),...,(xn,y)}\{(x_1,y), (x_2,y),...,(x_n,y)\}{(x1​,y),(x2​,y),...,(xn​,y)}, 我们设计一组函数集{fi∣fi=wix+bi,i=1,...,n}\{f_i| f_i= w_ix+b_i, i=1,...,n\}{fi​∣fi​=wi​x+bi​,i=1,...,n},对应的每个样本xxx, 每.

2021-09-17 09:25:53 129

转载 深度学习入门--感知器

深度学习是什么?感知器感知器的训练深度学习是什么?在人工智能领域,有个方法叫做机器学习。在机器学习的方法里,有一类算法叫神经网络。其原理如下图所示:上图中的每个圆圈都是一个神经元,每条线表示神经元之间的链接。每一层内的神经元没有连接,每层之间的神经元有连接。LayerL1Layer L_1LayerL1​是输入层,负责接受输入数据; LayerL2Layer L_2LayerL2​是隐藏层,往往用于提取输入数据的特征;LayerL3Layer L_3LayerL3​是输出层,将神经网络处理后.

2021-09-16 16:18:27 467

转载 深度学习入门学习--递归神经网络1

循环神经网络,它可以用来处理包含序列结构的信息。神经网络的输入层单元个数是固定的,因此必须用循环或者递归的方式来处理长度可变的输入。循环神经网络通过将长度不定的输入分割为等长度的小块,然后再依次的输入到网络中,从而实现神经网络对边长输入的处理。ex: 当输入一句话,我们可以把一句话看作是词组组成的序列,然后,每次向循环神经网络输入一个词,如此循环直至整句话输入完毕,循环神经网络将产生对应的输出。递归神经网络,可以处理图,树这样的递归结构。递归神经网络的前向计算递归神经网络是两个或多个子节点,输

2021-09-16 09:58:59 317

原创 李宏毅机器学习

P3–回归回归的定义回归的实例(宝可梦的cp值)梯度下降法过拟合问题正则项回归的定义Regression 试图确定一个因变量yyy(输出)与一些列其他变量 xxx(自变量)之间关系的强度与特征。回归的实例(宝可梦的cp值)step 1: 设计模型–线性模型step 2: 模型评估–loss functionstep 3: 模型优化–梯度下降法step 1: 设计模型–线性模型只考虑一个特征xcpx_{cp}xcp​,可以设计如下的线性模型y=wxcp+by = wx_{c

2021-09-15 19:58:05 93

原创 李宏毅机器学习

P1–机器学习介绍我们为什么要学习机器学习机器学习是什么机器学习的learning map我们为什么要学习机器学习现有的机器学习有很多种方法,比如在图像分割领域有传统基于水平集活动轮廓模型,分水岭模型,基于深度学习的方法。这么多种方法对所有的分割任务都有作用吗?答案是否定的。因此对于不同的任务需要不同的模型,我们的任务就是要寻找合适的模型解决遇到的问题。机器学习是什么?机器学习是什么:机器学习就是找到合适的函数根据提供的资料给出合理的答案机器学习的框架:step1: 给出一个f

2021-09-13 22:03:06 99

原创 论文写作-----Latex

模板链接IEEESpringer

2021-08-02 17:19:50 387

原创 如何关闭微软Edge小冰

如何关闭微软Edge小冰首先我们需要安装一个广告拦截插件AdGuard.打开浏览器右上角“…”,在选项弹窗下选择扩展。然后在该窗口下选择“获取 Microsoft Edge 扩展”,页面跳转至如下选择"AdGuard"扩展程序。安装完该插件之后,进入插件设置选择用户过滤器,在编辑框中写入下面两行命令cn.bing.com###ev_talkbox_wrappercn.bing.com###ev_talkbox_max随后,回到自己正常的工作即可。参考文献:如何在浏览器中安装AdG

2021-03-15 17:21:58 17368 11

原创 Matlab打开图像的几种方式

Matlab打开图像的几种方式

2021-03-01 09:54:08 4176

原创 BrainWeb网站使用

BrainWeb: Simulated Brain Database1.网站的使用Normal Brain DatabaseGround Truth下载2.当我们下载完成我们想要的图像之后,怎么打开,后续处理呢?有位博主已经介绍的非常清楚了,我就直接将网址贴在这儿:https://www.cnblogs.com/kailugaji/p/9875202.html这里面不仅包含对rawb文件如何打开的代码,还有原始图像分类别的处理,还包括对Ground Truth的处理的代码。...

2020-06-28 20:24:30 1794 1

原创 matlab求两个矩阵的Jaccard系数

A=[1,2,3;4,5,6;7,8,9];B=[1,2,1;3,5,6;4,7,2];A=A(:);%将矩阵A拉成一个列向量B=B(:);%将矩阵B拉成一个列向量C=[A';B'];%矩阵C由两个行向量组成,因为pdist(C,'jaccard')是行向量之间作比较D=pdist(C,'jaccard')

2020-06-24 08:50:34 2027 3

原创 matlab批量更改文件名+批量处理图像

matlab批量修改文件名:下面展示一些 内联代码片。// A code blockvar foo = 'bar';// An highlighted blockvar foo = 'bar';

2020-06-23 20:07:24 592

原创 搞清Δ,梯度, 方向导数,散度,拉普拉斯算子

搞清Δ,∇,\Delta, \nabla,Δ,∇, 方向导数,散度,拉普拉斯算子符号解释Δ\DeltaΔ它体现在公式中ΔT,Δx,Δy\Delta T,\Delta x,\Delta yΔT,Δx,Δy 也就是说Δ\DeltaΔ代表的是一个变量的变化;还用于表示Laplace算子∇\nabla∇它表示梯度(∂f∂x,∂f∂y,∂f∂z)(\frac{\partia...

2020-04-26 17:35:07 19423 2

原创 AOS加性算子分裂法

AOS加性算子分裂法加性算子分裂法顾名思义,就是在不同维度上分开讨论,最后相加。需要不同维度上正交。图像分割能量函数经过梯度下降法得到的的迭代公式一般为:∂ϕ∂t=μδϵ(ϕ)∇.(∇ϕ∣∇ϕ∣)+v∇(∇ϕ(1−1∣∇ϕ∣))+F(x,y)\frac{\partial \phi}{\partial t}=\mu \delta_{\epsilon}(\phi) \nabla.(\frac{\...

2020-04-11 11:28:15 1662 1

原创 二手书网站推荐

二手书推荐网站我对于电子书总觉得看不下去,还是比较喜欢纸质书。我主要用的几个网站(1)孔夫子旧书网https://www.kongfz.com/价格不定,有的价格低可能真的是正版二手但比价旧。有的价格低是扫描印刷版的。需要自己鉴别,但正版的书还是比较多的就拿数字图像这本书来说价格从10-100都有(2)有路网https://www.youlu.net/感觉这个网站是个挺神奇的网...

2020-03-27 11:51:14 3653

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除