朝朝暮暮Quake-CSDN博客

原创多模态大模型学习一

在一个很大的数据集（很大，例如imagenet）上跑一个模型（source model），这个模型具有抽取特征的能力；再拿一个自己的数据集在source model上微调（更小的学习率，或更多的层）。Few-Shot学习：在模型训练过程中，如果每个类别只有少量样本（一个或几个），研究人员希望机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习。但这种方法在大模型上不适用，因为大模型参数量等太大了，我们提供的数据量不够、计算资源不够，所以提出了zero-shot方法。

2025-04-18 15:22:46 303

原创测试网站dddd

每一个数是它前两个数的和，第n个数是多少。

2024-09-08 22:17:13 299

原创测试经典题

首先，做软件测试，我会分成四个阶段：分析需求–>设计测试方案–>执行测试–>总结【分析需求】先尝试获取网站的需求文档、技术设计等。这个体验仍然是为了尽可能地明确，网站主要为什么样的用户服务，为用户提供了什么样的帮助，网站每个功能的完整使用流程是怎样的。疑问和障碍如果能够消除，执行测试的效果是最好的。在这个过程中，并非简单的执行方案。API测试是针对应用程序的接口进行测试的实践。接口通常是指两个系统或组件之间的通信点，API测试主要关注的是验证这些接口在数据交换、功能实现和互操作性方面的正确性和可靠性。

2024-08-31 14:43:34 385

原创计网面经111

3、流量控制：TCP使用滑动窗口协议来控制发送方发送数据的速率，接收方会告诉发送方它的缓冲区大小，发送方会根据接收方的缓冲区大小来控制发送速率，确保接收方不会因为太快而丢失数据。2、序列号和确认号：TCP将每个数据段都分配一个序列号和确认号，序列号用于标识数据段的位置，确认号用于确认已经收到的数据段的位置，这样可以避免数据丢失或乱序。通过以上这些机制，TCP保证了数据的可靠传输，但是也会造成一定的延迟，因为数据包需要等待确认和重传，以及滑动窗口和拥塞控制会限制发送速率。

2024-08-24 23:25:11 441

原创测试资料4444

HTML:负责网页架构CS：负责网页的样式、美化JS:负责网页的行为。

2024-08-24 17:28:52 352

原创软件测试3333

禅道？学习正则表达式。

2024-08-21 17:42:25 447

原创测试资料2222

正向用例：一条尽可能覆盖多条逆向用例：每一条数据，都是一条单独用例。

2024-08-20 16:05:20 275

原创测试资料1111

软件是控制计算机硬件工作的工具。

2024-08-16 23:02:03 300

原创整理一些面经

学习目标：掌握Python的基础，如元组、字典、列表、集合、迭代器、生成器、闭包、装饰器，了解python的多线程、内存管理、垃圾回收机制！深拷贝（Deep Copy）和浅拷贝（Shallow Copy）是在复制对象或数据结构时所使用的两种不同的拷贝方法，它们之间的区别主要在于拷贝的程度和对原始对象内部结构的影响。浅拷贝创建一个新的对象，但是只复制原始对象的基本数据类型的字段或引用（地址），而不复制引用指向的对象。因此，对新对象所做的修改可能会影响到原始对象，因为它们共享相同的引用。

2024-08-15 21:08:01 381

原创迈向大规模小目标检测：综述与数据集

本文对小目标检测进行了全面回顾，首先对基于深度学习的小目标检测算法进行了系统性的综述，同时总结和回顾了常用的一些数据集。为了推动该领域的进一步发展，我们构建了第一个专为小目标检测定制的大规模数据集SODA，包含SODA-D和SODA-A。基于这两个数据集，我们对数个代表性算法进行了性能评估和对比。最后我们对小目标检测的预期发展进行展望：高效特征提取网络：如前所述，现有的骨干网络可能不利于提取小目标的高质量特征表示。

2024-08-07 11:17:59 861

原创 Augmentation for small object detection

我们对MS COCO数据集上的当前最先进模型Mask-RCNN进行了分析。我们发现小物体的ground-truth与预测的锚框之间的重叠远远低于预期的IoU阈值。我们推测这是由两个因素造成的：（1）只有少数图像包含小物体，（2）即使在包含小物体的每个图像中，小物体也没有足够的出现次数。因此，我们提出对那些包含小物体的图像进行过采样，并通过多次复制粘贴小物体来增强每个图像。

2024-08-07 10:56:54 834

原创安装mmdetection

根据自己的cuda版本和torch版本修改下面的网址，找到对应的下载并安装。mmdetection版本:2.11.0。python版本：3.7。

2024-06-28 10:15:34 211

原创 Selective Kernel Networks（CVPR-2019）

提出了一种动态选择机制，允许每个神经元根据输入信息的多个尺度自适应调整感受野大小。设计了一种称为选择核（SK）单元的结构块，利用softmax attention 对不同核大小的多个分支进行融合。对这些分支的不同attention产生融合层神经元有效感受野的不同大小。多个SK单元被堆叠成一个称为选择性核的网络SKNets。文章提出了一种非线性方法，从多个内核中聚合信息，实现神经元的自适应RF大小。我们引入了 “选择性内核”（SK）卷积，它由三组运算符组成：Split, Fuse and Select。

2024-06-14 16:33:10 374

原创 1*1卷积核实现升维降维

升维：卷积核shape为[1,1,3,10],即10组[1,1,3]的卷积核，先用其中一组对这张图片卷积得到[32,32,3]的数据，然后将这3为数据相加之后得到[32,32,1]，所以10组卷积核能得到[32,32,10]的输出，这样改变了维度。来源：https://zhuanlan.zhihu.com/p/661786236。假设现在有一张图片形状为[32,32,3],32为长和宽，3代表通道数。降维：同理，只需将10改为想要的维度就可以了。

2024-06-14 11:25:01 752

原创【无标题】

链接: linkdior数据集的txt改为yolo格式链接: link

2024-05-15 13:58:58 156

原创将NWPUD数据集转化为yolo格式

2024-05-10 19:49:28 154

原创 Dropout Feature Ranking for Deep Learning Models

深度神经网络( Deep Neural Networks，DNNs )已经开始在生物学和医疗保健领域崭露头角，包括基因组学( Xiong et al . , 2015)、医学影像( Esteva et al , 2017)、EEG ( Rajpurkar et al , 2017)和EHR ( Futoma et al , 2017)。然而，DNNs是黑盒模型，因其不可解释性而臭名昭著。在生物学和医疗保健领域，为了推导出可以通过实验验证的假设，提供关于哪些生物学或临床特征驱动预测的信息是至关重要的。

2024-04-23 23:29:30 1124

原创 Object Detection of Remote Sensing Images

总之，为了解决在密集场景和复杂背景下检测小物体的困难，同时保持相对较高的精度，一种基于多核扩张卷积（MDC）和变压器的新型单阶段物体检测模型MDCT for RSOD 本文提出了块。卷积与扩张卷积的不同之处在于，卷积中的像素是连续的并且集中于卷积的特征。因此，我们的工作重点是密集场景和复杂背景中的小物体，并提出了一种基于多核扩张卷积和变压器的新型单阶段物体检测模型。此外，一阶段目标检测模型中主要的级联方法与上下文无关，容易导致特征信息丢失，在密集场景和复杂背景下难以区分目标和背景特征。

2024-04-17 20:40:21 130

原创 Salient Object Detection in Optical Remote Sensing Images Driven by Transformer

最近开发了基于 Transformer 的目标检测，以应对基于区域提议和基于回归的目标检测所面临的大计算负载和精度牺牲之间的权衡困境，其自注意力机制可以提供具有潜在能力的全局理解用于推理稀疏异构分布的地理空间对象内的位置关系。最近，开发了基于变压器的目标检测方法[15]、[16]和[17]。随着遥感图像空间分辨率的提高，从对地观测中频繁、准确地识别感兴趣的地理空间目标对于广泛的应用至关重要，例如城市规划中的违法建设[1]、[2]、军事侦察[3]、以及用于交通控制的飞机和车辆监控[4]，[5]。

2024-04-17 19:05:34 150

原创 An Improved Swin Transformer-Based Model for Remote Sensing Object Detection and Instance Segmentati

为了解决这些问题，我们基于 Transformer 和 CNN 的优点改进了 Swin Transformer，设计了局部感知 Swin Transformer (LPSW) 主干来增强网络的局部感知，提高小规模的检测精度。自注意力机制的结构如图2所示。近年来，虽然出现了许多优秀的算法，如路径聚合网络（PANet）[8]、Mask Score R-CNN [9]、Cascade Mask R-CNN [10]以及按位置分割对象（SOLO）[ 11]，典型的问题仍然存在，例如分割边缘不准确和全局关系的建立。

2024-04-17 15:51:28 716

原创 Transformer with Transfer CNN for Remote-Sensing-Image Object Detection

所提出的带有数据增强的 T-TRD（T-TRD-DA）在两个广泛使用的数据集（即 NWPU VHR-10 和 DIOR）上进行了测试，实验结果表明所提出的模型提供了有竞争力的结果（即，与竞争基准方法相比，百倍平均精度为 87.9 和 66.8，最多分别比 NWPU VHR-10 和 DIOR 数据集上的比较方法高出 5.9 和 2.4，这表明基于 Transformer 的方法打开了 RSI 对象检测的新窗口。因此，TRD 可以处理多个尺度的 RSI，并从 RSI 中识别出感兴趣的对象。

2024-04-17 15:26:08 1154

原创 P2FEViT: Plug-and-Play CNN Feature Embedded Hybrid Vision Transformer for Remote Sensing Image Class

设计目标如下：首先，cls_token源自CNN提取的特征，它描述了输入图像的整体特征，而不是某个patch对应的特征，因此不会导致对特定区域的过度学习倾向。回顾 ViT 和 CNN 模型在自然场景图像分类数据集 ImageNet [6] 上的性能，我们发现，如果没有在较大的数据集上进行预训练，ViT 模型往往具有较差的分类性能。其次，旨在整合CNN和ViT的优点，提出了一种将CNN特征嵌入到ViT架构中的新方法，可以使模型同步捕获和融合全局上下文和局部多模态信息，进一步提高ViT的分类能力。

2024-04-17 14:52:15 486

原创 TRS: Transformers for Remote Sensing Scene Classification

在本文中，我们开发了一种基于ResNet50和Transformer架构的遥感Transformer（TRS），它显着提升了遥感场景分类性能并减少了模型对卷积运算的依赖。与传统的“卷积+Transformer”方法不同，我们不是简单地将CNN和Transformer连接起来，而是将Transformers集成到CNN中。我们将 Transformer 应用于遥感场景分类，并提出了一种新颖的“纯 CNN → CNN + Transformer → 纯 Transformer”结构，称为 TRS。

2024-04-17 10:37:25 463

原创 Hyperspectral Image Classification Using Spectral–Spatial Token Enhanced Transformer With Hash-Based

受到基于 Transformer 的模型在计算机视觉各种任务中提取远程特征的能力的启发 [24]，[25]，[26]，[27]，前期工作 [28]，[29]，[ 30]、[31]、[32]、[33]、[34]引入了用于HSI分类的变压器结构，并取得了可喜的结果。[28]和[30]中的工作捕获了远程空间特征，但忽略了短程空间信息的重要性。值得注意的是，合并 CNN 和 Transformer 在计算机视觉领域表现出了良好的性能 [35]、[36]、[37]、[38]，但在 HSI 分类中尚未得到深入研究。

2024-04-17 10:31:59 447 1

原创 Advancing Plain Vision Transformer Toward Remote Sensing Foundation Model

在本文中，我们采用具有约 1 亿个参数的普通 ViT，并首次尝试提出适合 RS 任务的大型视觉模型，并研究此类大型模型的性能。为了处理RS图像中的大尺寸和任意方向的物体，我们提出了一种新的旋转可变尺寸窗口注意力来取代变压器中原来的完全注意力，这可以显着减少计算成本和内存占用，同时通过提取学习更好的对象表示来自生成的不同窗口的丰富上下文。检测任务的实验表明我们的模型优于所有最先进的模型，在 DOTA-V1.0 数据集上实现了 81.24% 的平均精度（mAP）。

2024-04-17 09:52:43 282

原创交叉熵损失函数

P(x)代表真实分布的概率，Q(x)代表在预测分布中的概率，log代表自然对数。交叉熵越小，表示预测分布和真实分布越接近，性能越好。其中，C表示类别数，y代表真实标签的one-hot编码，p是模型的预测概率。因此模型与真实标签的预测越接近，损失函数越小。交叉熵损失函数还具有平滑性和凸性质，能够保证优化过程的稳定性和收敛性。在机器学习中用于损失函数。在信息论中，用于衡量两个概率分布之间的差异。

2024-03-14 11:15:51 315 1

原创删除python环境

2，sudo rm -rf +文件夹路径。1、找到python环境所在的文件夹。

2024-01-08 10:12:13 855

原创 vim指令

wq：保存退出ESC：输入指令i：编辑。

2024-01-08 09:59:09 449

原创 xlsxwriter.exceptions.FileCreateError: [Errno 13] Permission denied: ‘E:

如果你尝试了各种修改文件权限的方法都还不行的话。有可能是因为你打开了想要修改的文件，关闭就好啦。

2023-11-23 15:30:36 307

原创全连接层是什么

全连接层（FC）在整个卷积神经网络中起到“分类器”的作用，是每一个节点都与上一层的所有结点相连。

2023-11-22 17:01:37 629

原创一点DETR学习

主要是为了学习query。

2023-11-22 15:11:08 146

原创 Attention is all your need

最后一个点对点前馈层的输出经过一个最后的线性层，该层充当分类器，分类器的大小与所拥有的类别数相同。较高的softmax得分会保留模型认为更重要的词的值。分割后的向量分别经过相同的自注意力过程，每个自注意力过程就被称为一个头，每个头会产生一个输出向量，这些向量在经过最后的线性层之前被拼接成一个向量。解码器是自回归的，它将先前输出的列表作为输入，以及包含来自输入的注意力信息的编码器输出。多头注意力是一个模块，用于计算输入的注意力权重，并生成一个带有编码信息的输出向量，指示序列中的每个词如何关注其他所有词。

2023-11-20 16:38:23 105

原创 ViT和DETR

https://blog.csdn.net/qq_41895003/article/details/124927194

2023-11-19 19:29:05 66

原创 CBAM:Convolutional Block Attention Module

一般来说，注意力机制通常被分为以下基本四大类：通道注意力 Channel Attention，告诉网络 what to pay attention to空间注意力机制 Spatial Attention，告诉网络 where to pay attention to时间注意力机制 Temporal Attention，告诉网络 when to pay attention to分支注意力机制 Branch Attention，告诉网络 which to pay attention to。

2023-11-04 15:59:31 166

原创 TOP-1和TOP-5错误率指什么

top-5错误率：对每幅图像同时预测5个标签类别，若预测的5个类别任意之一为该图像的正确标签，则视为预测正确，那么预测错误的概率即为top-5错误率。top-1错误率：若对图像预测1个标签类别，预测错误的概率为top-1错误率。

2023-11-02 15:50:35 189

原创单阶段检测器存在正负样本不均问题的原因

锚框匹配问题：单阶段检测器通常使用锚框（anchor boxes）来预测目标的位置和类别。在训练过程中，需要将锚框与真实目标进行匹配，以确定哪些锚框是正样本，哪些是负样本。由于目标较少且分布稀疏，往往会导致大多数锚框被划定为负样本，进一步加剧了正负样本之间的不均衡问题。目标密度不均衡：在真实场景中，目标通常是稀疏分布的，即大部分图像区域是背景，而目标只占据少数区域。这导致了正样本（包含目标）的数量相对较少，而负样本（背景）的数量较多，造成了正负样本之间的不均衡。

2023-10-25 10:04:16 127

原创 csp结构是什么

CSP结构通过将输入特征分为两部分，然后在这两个部分之间进行交叉连接的方法来提高深度神经网络的性能。CSP结构能有效提高模型的特征表示能力，从而提高模型的准确性和泛化能力。

2023-10-17 15:53:48 3212

原创 softmax

Softmax函数可以将上一层的原始数据进行归一化，转化为一个（0，1）之间的数值，这些数值可以被当做概率分布，用来作为多分类的目标预测值。Softmax函数一般作为神经网络的最后一层，接受来自上一层网络的输入值，然后将其转化为概率。通过Softmax函数就可以将多分类的输出值转换为范围在[0, 1]和为1的概率分布。

2023-10-11 20:26:32 1407

原创 Dropout

Dropout说的简单一点就是：我们在前向传播的时候，让某个神经元的激活值以一定的概率p停止工作，这样可以使模型泛化性更强，因为它不会太依赖某些局部的特征。在训练过程中，如果出现训练样本太少，模型参数太多的情况，模型容易出现过拟合。Dropout就是一个有效的缓解过拟合的操作。

2023-10-11 13:52:04 42

原创 Transformer详解

https://zhuanlan.zhihu.com/p/420820453

2023-10-10 16:39:52 80

机器学习一篇0样本学习的报告，研一课程作业

2023-10-08

数据挖掘adaboost在人脸检测中的运用论文.docx

信息时代和网络时代的到来，使得人们创造的数据量指数级上升。如何通过互联网挖掘信息，又如何对获得的数据进行分析处理已成为人们研究的热点。分类算法是一种有监督的学习。它通过对一群已经分好类的样本数据进行学习，搜索出隐藏于数据中的信息并据此构造模型，从而对新的未分类的数据进行划分。Adaboost算法就是一种迭代的分类算法，其核心思想是针对同一个训练集训练不同的分类器（弱分类器），然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）。--百度百科。它在人脸检测方面的显著成就使人们对它的研究兴趣不减。本文主要针对Adaboost算法的来源、发展、原理以及在人脸识别方面的应用进行阐述，最后对Adaboost算法的优缺点进行了分析

2023-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人