自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Envi实验五--实验报告

答:1.蓝色对应的H:100~124,将绿色地物的波段范围改为蓝色天空的波段范围即可2.HSV颜色空间的模型对应于圆柱坐标系中的一个圆锥形子集,圆锥的顶面对应于V=1.它包含RGB模型中的R=1,G=1,B=1三个面,所代表的颜色较亮。绿色对应的V:43-255。答:HSV需要输入图像的数据是有值域范围的,HSV的值域分别为0°-360°,0%-100%,0%-100%。答:(float(b4)-float(b3))/(float(b4)+float(b3))的计算结果和ENVI菜单的NDVI结果相同。

2024-07-29 17:31:58 460

原创 Envi实验四--实验报告

Ⅰ·南京上空TM图像共6个波段。

2024-07-29 16:43:32 165

原创 Envi实验三----实验报告

答:Scoll、Image、Zoom的图像大小范围不同,全景窗口Scoll拥有最多数量的灰度级,图像窗口Image次之,放大窗口Zoom最少,所以三个窗口对应的累计%2和累计%98的灰度级不同,拉伸的效果就不同。:假彩色合成是指多光谱遥感图像彩色合成处理时,如果参与合成的三个波段的波长与对应的红、绿、蓝三种原色的波长不同,那么合成图像的颜色就不可能是地面景物的真是颜色,这种合成就是假彩色合成。图像拉伸包括:线性拉伸,2%拉伸,高斯拉伸,平方根拉伸,交互拉伸等。直方图值集中在图像左侧,图像较暗。

2024-07-21 09:15:30 753

原创 信息熵,KL散度,JS散度与Wasserstein距离----GAN到WGAN的进化之路

因为生成器的初始参数是随机初始化的,所以它什么都没有学习到,输入一系列采样得到的向量给它,它的输出都是些随机、混乱的图片,然后我们根据真实的数据送入判别器与生成的数据做对比,我们把真正的图片标 1,生成器产生出来的图片都标 0。网络框架如下图所示。其实到这里我们不难看出,判别器的训练目标是看到真实数据就给它比较高的分数,看到生成的数据就给它比较低的分数,我们可以把它当做是一个优化问题,具体来说,我们要训练一个判别器,其可以最大化一个目标函数,当然如果我们最小化它就可以称它为。生成的事物是真实的还是生成的;

2024-07-16 18:24:47 1044 1

原创 自监督学习

在机器学习范畴中,可以分为有监督学习,无监督学习,有监督学习顾名思义就是有“监督者”–标签来“监督”学习的好坏;无监督学习,顾名思义就是没有“监督者”–标签,来“监督”学习的好坏,所以有监督学习和无监督学习最大的区别就是有无“监督者”–标签。Yann LeCun最初在2019年4月在FaceBook发帖第一次提出了自监督学习这个词,自监督学习无需要标签,主要利用代理任务(pretext)来从大规模的无监督数据中找到自身的监督数据。

2024-07-10 11:37:06 271 1

原创 网络训练过程中为什么要划分batch

在计算梯度的时候,并不是对所有数据的损失 L 计算梯度,而是把所有的数据分成一个一个的批量(batch),如下图所示。每个批量的大小是 B ,即带有 B 笔数据。每次在更新参数的时候,会去取出 B 笔数据用来计算出损失和梯度更新参数。遍历所有批量的过程称为一个回合(epoch)。事实上,在把数据分为批量的时候,我们还会进行随机打乱(shuffle)。随机打乱有很多不同的做法,一个常见的做法是在每一个回合开始之前重新划分批量,也就是说,每个回合的批量的数据都不一样。

2024-07-05 18:02:16 512

原创 网络训练过程中有关梯度产生的问题

在深度神经网络训练过程中,反向传播会计算梯度,并且默认情况下这些梯度会累积在各个参数的梯度缓存(例如PyTorch中的param.grad)中。如果不在每次反向传播之前清零梯度,这些累积的梯度会导致下一个数据在反向传播更新参数时使用错误的梯度值,从而影响训练效果。在反向传播过程中,计算得到每个参数的梯度,这些梯度存储在参数的梯度属性中。2·在长时间不清零梯度的情况下,梯度值可能变得非常大,导致模型参数更新过大,训练过程不稳定,甚至可能导致梯度爆炸。例如,在处理非常大的模型或数据集时,可以使用梯度累积技巧。

2024-07-05 17:41:18 762

原创 RCNN全家桶

RCNN利用传统的目标检测的思想,将目标检测当做分类问题进行处理,即提取后选取,对后选取的目标进行分类。具体包括以下4步:生成候选区,对每个候选区进行特征提取,对提取的特征进行分类,选择与目标拟合度最好的候选框。RCNN的缺点:(1)训练和测试速度慢。(2)输入CNN的候选区域尺寸是固定的,精度降低。(3)候选区域需要提前提取并保存,占用的空间很大。

2024-06-19 11:43:41 318

原创 one stage与two stage

对于one stage,如YOLO系列,对于给定的图像所需要识别的对象,只需要回归出其边框的一个对角的(x,y)与其类别即可。如图中所示,只需得到输出结果中的边框的一个对角的两个坐标即可,所以可以直接回归得到(如输出结果的边框中的左上角点坐标,与右下角点坐标)。其优点:速度快;避免背景错误产生false positives;学到物体的泛化特征。其缺点:精度低(定位、检出率);小物体的检测效果不好。

2024-06-18 15:53:01 121

原创 目标检测中SIFT,HOG,DPM分别是什么

目标检测是计算机视觉中的一个重要任务,主要用于识别和定位图像或视频中的目标物体。SIFT(尺度不变特征变换)、HOG(方向梯度直方图)和DPM(Deformable Part Model)是目标检测中常用的三种方法。

2024-05-20 14:08:26 298

原创 目标检测网络模型种类

目标检测是一种计算机视觉任务,其目标是识别和定位图像或视频中的对象。为了实现目标检测,研究人员开发了多种网络模型,这些模型可以大致分为两类:单阶段(single-stage)模型和两阶段(two-stage)模型。

2024-05-20 01:26:42 448

原创 批量复制特定文件后缀的文件

其中/path/to/source/*.txt为源文件路径,.txt可以改成想要复制的目标文件后缀;/path/to/destination为目标文件夹路径,即想要转进的文件夹路径。

2024-05-12 10:14:57 216

原创 transformer代码实现

对于输入句子,汉字之间需要加空格。

2024-05-08 13:11:04 870

原创 self attention在单头转多头中,如何将q,k,v分裂

在单头转多头中,将Q(查询)、K(键)和V(值)分裂是实现self-attention的关键步骤之一。这个过程可以通过线性变换来完成。

2024-04-19 20:25:34 534

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除