自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(69)
  • 收藏
  • 关注

原创 手写文本识别系统的最佳实践

手写文本识别在近年来随着深度学习及其应用的兴起而快速发展。尽管深度学习方法在文本识别性能上提供了显著的提升,但是即使在小幅改变预处理或架构/优化元素时,也能检测到性能的非微不足道的偏差。这项工作遵循“最佳实践”的推理方式;强调简单而有效的实证实践,这些实践可以进一步帮助训练并提供性能优越的手写文本识别系统。具体来说,作者考虑了深度HTR系统的三个基本方 面,并提出了一些简单而有效的解决方案:在预处理步骤中保持图像的宽高比;使用最大池化将CNN输出的3D特征图转换为一组特征序列;

2024-04-27 11:15:20 362

原创 BiSeNet的复仇:高效的多任务图像分割

近期在图像分割领域的进展主要集中在提高模型的效率,以满足实时应用的需求,特别是在边缘设备上。然而,现有的研究主要集中于单任务设置,尤其是语义分割,这导致了针对不同任务产生重复劳动和专业架构。为了克服这一限制,作者提出了一种新颖的高效多任务图像分割架构,能够在不牺牲效率或准确性的情况下处理各种分割任务。作者引入了BiSeNetFormer,它利用了两流语义分割架构的效率,并将其扩展为一种 Mask 分类框架。

2024-04-27 11:00:58 349

原创 WiTUnet:一种集成CNN和Transformer的u型架构,用于改进特征对齐和局部信息融合

低剂量计算机断层扫描(LDCT)已成为诊断医学成像的首选技术,这是由于与X射线辐射和传统计算机断层扫描(CT)技术相关的潜在健康风险。尽管LDCT与标准CT相比使用较低的辐射剂量,但它导致了图像噪声的增加,这可能会影响诊断的准确性。为了解决这一问题,已经开发了基于高级深度学习的LDCT去噪算法。这些算法主要利用卷积神经网络(CNNs)或Transformer网络,并且通常采用Unet架构,通过 Short-Cut (skip connections)整合编码器和解码器的特征图来增强图像细节。

2024-04-26 15:04:32 490

原创 文字控制的Mamba运动:文字指导的人类运动的时间基础

人类动作理解是一项具有多种实际应用的基本任务,这一任务得益于大规模动作捕捉数据集的可用性。最近的研究关注于文本动作任务,例如基于文本的动作生成、编辑和问答。在本次研究中,作者引入了基于文本的人类动作定位(THMG)这一新任务,旨在精确地在未修剪的动作序列中定位与给定文本描述相对应的时间段。捕捉全局时间信息对于THMG任务至关重要。然而,基于Transformer的模型依赖于全局时间自注意力,在处理长的未修剪序列时,面临着因二次计算成本带来的挑战。

2024-04-26 14:34:29 494

原创 CU-Mamba:具有通道学习功能的选择性状态空间模型用于图像恢复

重建退化图像是图像处理中的关键任务。尽管基于卷积神经网络(CNN)和Transformer的模型在该领域中非常普遍,但它们存在固有的局限性,比如对长距离依赖的建模不足以及高计算成本。为了克服这些问题,作者引入了通道感知U型Mamba(CU-Mamba)模型,它将双状态空间模型(SSM)框架融入到U-Net架构中。CU-Mamba使用空间SSM模块进行全局上下文编码,并采用通道SSM组件来保持通道相关性特征,两者相对于特征图大小都具有线性计算复杂性。

2024-04-24 14:53:32 960

原创 广度优先搜索(BFS)

它从起始节点开始,逐层地向外扩展,首先探索当前节点的所有邻居节点,然后逐层深入地探索更远的节点,直到找到目标节点或者遍历完整个图。由于BFS的特性是逐层探索,所以当找到目标节点时,其所在的层数即为最短路径的长度。在单词接龙问题中,给定一个起始单词和一个目标单词,要求通过逐步替换单词中的字母,从起始单词变换到目标单词。BFS可以用于检测图中的连通性,即判断图中是否存在一条路径可以从一个节点到达另一个节点。搜索过程中保证按照节点的层次顺序进行,即先探索完当前层次的所有节点,然后再探索下一层次的节点。

2024-04-24 14:44:00 264

原创 使用文本到图像模型的一步图像翻译

在这项工作中,作者解决了现有条件扩散模型的两个局限性:由于迭代去噪过程导致的推理速度慢以及模型微调对配对数据依赖的问题。为了解决这些问题,作者引入了一种通过对抗性学习目标将单步扩散模型适应到新任务和领域的一般方法。具体来说,作者将原始潜扩散模型中的各种模块整合为一个具有小可训练权重的端到端生成网络,增强了其在保留输入图像结构的同时减少过拟合的能力。

2024-04-23 15:11:50 729

原创 MobileNet V4——移动设备的通用模型 生态系统

作者介绍了最新一代的MobileNets,名为MobileNetV4(MNv4),其特点是针对移动设备设计的通用高效架构。在其核心部分,引入了通用倒瓶颈(UIB)搜索块,这是一个统一且灵活的结构,它融合了倒瓶颈(IB)、ConvNext、前馈网络(FFN)以及一种新颖的额外深度可分(ExtraDW)变体。与UIB并行,我们提出了Mobile MQA,这是一个专为移动加速器设计的注意力块,能带来显著的39%速度提升。同时,作者还介绍了一种优化的神经架构搜索(NAS)方法,它提高了MNv4搜索的有效性。

2024-04-23 15:05:18 722

原创 Pytorh checkpoint系统深入解析以及优化(02)

调用方result = fn(storage, location)中,location是’cuda:0’,所以会进入_cuda_deserialize,最核心的是return obj.cuda(device)这个调用,里面会做cudaMemCpy。序列化的时候tensor额外被dump了,dump的时候类型都是storage,data是具体的tensor的数据。和序列化的时候对应,对zip文件调用_load,非zip文件(_legacy_save的那种)调用_legacy_load。

2024-04-21 09:58:31 787

原创 Pytorh checkpoint系统深入解析以及优化(01)

然后注意这一行:storage_key = id_map.setdefault(storage._cdata, str(len(id_map))) 如果键不存在于字典中,将会添加键并将值设为默认值。由于id_map一开始是空的,等同于添加key storage._cdata,value为递增的整数,storage_key也是递增的整数。这段代码的含义是根据用户的输入,选择不同的压缩算法和序列化方式,然后调用真正的序列化函数_save或者_legacy_save(目前先只看save)。

2024-04-21 09:57:44 699

原创 BEVCar:用于BEV地图和目标分割的相机-雷达融合

鸟瞰视角下的语义场景分割对于移动机器人的规划和决策至关重要。虽然最近的仅依靠视觉的方法在性能方面取得了显著进展,但它们通常在恶劣的光照条件下(如雨天或夜间)表现不佳。虽然主动传感器提供了解决这一挑战的方案,但激光雷达的 prohibitively 高成本仍然是一个限制因素。将摄像机数据与汽车雷达融合提供了一种更廉价的替代方案,但在先前的研究中受到了较少关注。在这项工作中,我们旨在通过引入 BEVCar,一种新颖的联合 BEV 对象和地图分割方法,推进这一有前途的途径。

2024-04-20 10:07:03 1141

原创 MambaDFuse:一种基于mamba的多模态图像融合双相位模型

多模态图像融合(MMIF)旨在将来自不同模态的互补信息整合到单一的融合图像中,以全面地表征成像场景并促进下游视觉任务的完成。近年来,由于深度神经网络的进步,在MMIF任务上取得了显著的进展。然而,现有方法受到固有的局部还原性偏差(CNN)或二次计算复杂度(Transformers)的限制,无法有效且高效地提取模态特定和模态融合特征。为了克服这个问题,作者提出了一个基于Mamba的双阶段融合(MambaDFuse)模型。

2024-04-20 09:57:28 912 4

原创 鲁棒无监督人群计数与定位

现有的群体计数模型需要大量的训练数据,而这些数据的标注过程耗时且繁琐。为了解决这个问题,作者提出了一种简单而有效的人群计数方法,通过采用一种名为“Segment-Everything-Everywhere Model(SEEM)”的模型——这是对“Segmentation Anything Model(SAM)”的一种改进,来为训练人群计数模型生成伪标签。然而,作者的初步调查发现,SEEM在密集人群场景中的性能有限,这主要是因为在行人高密度区域遗漏了许多人。

2024-04-19 16:07:08 863

原创 SpectralMamba:用于高光谱图像分类的高效 Mamba

递归神经网络和Transformer最近在光谱成像(HS)的大多数应用中占据主导地位,这归功于它们能够从光谱序列中捕捉长距离依赖关系。然而,尽管这些序列架构取得了成功,但由并行化困难或计算上过于昂贵的注意力所引起的不可忽视的低效率仍然限制了它们的实用性,特别是在遥感场景中的大规模观测。为了解决这个问题,作者提出了SpectralMamba——一种新颖的状态空间模型融合的高效深度学习框架,用于HS图像分类。SpectralMamba在两个层面上简化但对HS数据动态的建模是充分足够的。

2024-04-19 15:56:34 598

原创 AIDE:自动驾驶目标检测的自动数据引擎

自动驾驶车辆(AV)系统依赖于健壮的感知模型作为安全保证的基石。然而,道路上遇到的物体表现出长尾分布,罕见或未见过的类别对部署的感知模型提出了挑战。这需要耗费大量人力进行持续的数据策划和标注。作者 Proposal 利用视觉语言和大型语言模型最近的进展来设计一个自动数据引擎(AIDE),它能自动识别问题,高效策划数据,通过自动标注改进模型,并通过生成多样化场景来验证模型。这个过程是迭代进行的,允许模型持续自我提升。

2024-04-18 21:59:41 1201

原创 Simba:Mamba 增强了 U-ShiftGCN,用于视频中的骨骼动作识别

骨架动作识别(SAR)涉及使用骨骼关节坐标及其互联来识别人类动作。尽管已经尝试将普通的Transformer应用于这项任务,但它们与基于图卷积网络(GCNs)的当前领先方法相比仍有不足,这是由于缺乏结构先验。最近,一种新颖的选择性状态空间模型Mamba作为Transformer中注意力机制的强有力替代品出现,它有效地建模了长序列。在这项工作中,据作者所知,作者首次提出了一个结合了Mamba的SAR框架。作者模型的每个基本块采用了新颖的U-ShiftGCN架构,以Mamba为其核心组件。

2024-04-18 21:54:55 976

原创 LaVy: 越南多模态大型语言模型

大规模语言模型(LLMs)和多模态大规模语言模型(MLLMs)以其在复杂推理和语言理解方面的卓越能力在全球范围内引起了轰动。尽管有关越南大型语言模型的研究成果层出不穷,但多模态方面高质量资源的缺乏限制了越南MLLMs的发展。在本文中,作者首次通过引入LaVy,这是一个先进的越南MLLM,来解决这一问题。同时,作者还介绍了专门用于评估MLLMs在越南视觉语言任务上理解能力的LaVy-Bench基准。

2024-04-17 10:54:15 785

原创 LUCF-Net:轻量级U形级联 用于医学图像分割的融合网络

在本研究中,通过添加Transformer,作者增强了现有U型神经网络架构在医学图像分割中的性能。尽管Transformer架构在提取全局信息方面非常强大,但由于其高复杂性,其在捕捉局部信息方面的能力有限。为了应对这一挑战,作者提出了一种新的轻量级U型级联融合网络(LUCF-Net)用于医学图像分割。它采用了不对称的结构设计,并结合了局部和全局模块,以增强其在局部和全局建模方面的能力。此外,还设计了一个多层级联融合解码网络,以进一步增强网络的信息融合能力。

2024-04-17 10:47:55 874

原创 ViM-UNet:用于生物医学细分的 Vision Mamba

卷积神经网络(CNNs),尤其是UNet,是生物医学分割的默认架构。已经提出了基于Transformer的方法,如UNETR,以取代它们,得益于全局视野,但受到更大的运行时间和更高的参数数量的影响。最近的Vision Mamba架构为Transformer提供了一个有吸引力的替代方案,同样提供了全局视野,但效率更高。在这里,作者介绍了基于它的ViM-UNet,一种新颖的分割架构,并将其与UNet和UNETR在两个具有挑战性的显微实例分割任务上进行比较。

2024-04-16 17:54:45 1141 1

原创 2022-MIA:基于边界感知上下文神经网络的医学图像分割Boundary-aware context neural network for medical image segmentation

医学图像分割可以为进一步的临床分析和疾病诊断提供可靠的依据。随着卷积神经网络(CNN)的发展,医学图像分割性能有了显著的提高。然而,大多数现有的基于CNN的方法往往产生不令人满意的分割掩模没有准确的对象边界。这个问题是由有限的上下文信息和连续池化和卷积操作后的不充分的区分特征映射引起的。此外,医学图像的特点是高类内变化,类间不区分和噪声,提取强大的上下文和聚合的细粒度分割的区别性特征仍然具有挑战性。

2024-04-16 17:37:33 871

原创 Transformers 微调

一个典型的数据点包括文本和相应的标签。

2024-04-15 11:03:32 812

原创 如何实现一个端对端分支

选择优化器类型首先,选择适合你的分支模型的优化器类型。常见的优化器包括随机梯度下降(SGD)、Adam、RMSprop等。根据你的需求和模型的特性选择最合适的优化器。定义优化器对象使用你选择的深度学习框架(如TensorFlow、PyTorch等)提供的优化器类来定义一个优化器对象。根据框架的文档,创建一个与分支模型关联的优化器对象。配置优化器参数配置优化器对象的参数,包括学习率、动量、衰减率等。根据你的训练需求和分支模型的特性,调整优化器的参数以达到最佳的训练效果。将优化器与模型关联。

2024-04-15 10:44:18 899

原创 消除 BEV 空间中的跨模态冲突,实现 LiDAR 相机 3D 目标检测

近期,3D目标检测器通常利用多传感器数据和在共享的鸟瞰图(BEV)表示空间中统一多模态特征。然而,我们的实证研究发现,以前的方法在生成无跨模态冲突的融合BEV特征方面存在局限性。这些冲突包括由BEV特征构建引起的外在冲突和源于异质传感器信号的内在冲突。因此,提出了一种新颖的消除冲突融合(ECFusion)方法,以明确消除BEV空间中的外在/内在冲突,并生成改进的多模态BEV特征。具体而言,设计了一个语义引导的基于流的对齐(SFA)模块,在融合之前通过统一BEV空间中的空间分布来解决外在冲突。

2024-04-14 15:36:47 986

原创 【无标题】

计算机视觉是一门充满挑战和机遇的领域,其在现代科技和工程领域中的应用与日俱增。通过系统地学习基础知识、深入理解理论,并积极参与实践项目,个人能够逐步掌握计算机视觉的核心技术和方法。从图像处理到深度学习,从目标检测到图像生成,这一过程不仅是技术上的进步,更是对于智能系统理解视觉世界的探索。持续学习和保持热情是取得成功的关键。随着技术的不断更新和行业的快速变化,保持学习状态显得尤为重要。

2024-04-14 14:59:19 850

原创 关于DFS的学习

在递归版本中,可以通过函数参数传递已访问的节点集合,在非递归版本中,通常使用一个额外的集合来记录已访问节点。:传统的DFS从单一起点开始搜索,而双向DFS则同时从起点和终点开始搜索,通过两个方向的搜索相遇来减少搜索的时间复杂度。以上只是DFS算法的一些拓展和具体应用,实际上,DFS算法在解决各种问题中都有广泛的应用。:将迷宫视作图的问题,起点为迷宫的入口,终点为出口,可以使用DFS算法来寻找从起点到终点的路径。通过表示问题的状态和状态之间的转移关系,DFS可以搜索可能的解空间,并找到问题的解。

2024-04-12 15:17:47 882 1

原创 Sigma:用于多模态语义分割的Mamba网络

多模态语义分割显著提高了AI代理在不利条件下的感知和场景理解能力,尤其是在低光或过度曝光的环境中。利用热成像和深度等额外模态(X模态)与传统RGB数据相结合,提供了互补信息,使得分割更加健壮和可靠。在这项工作中,作者介绍了Sigma,一个用于多模态语义分割的暹罗眼镜蛇网络,它采用了选择性结构化状态空间模型Mamba。与依赖于局部感受野有限的CNN或以二次复杂度为代价提供全局感受野的视觉 Transformer (ViTs)的常规方法不同,作者的模型以线性复杂度实现了全局感受野的覆盖。

2024-04-12 15:13:34 698

原创 Mixed-Query Transformer:统一的图像分割架构

在现有的一体化图像分割模型中,要么在多个任务上采用统一的架构但为每个数据集使用特定的权重,要么在多个数据集上应用单一权重集但仅限于单一任务。在本文中,作者引入了混合 Query Transformer (MQ-Former),这是一种用于多任务和多数据集图像分割的统一架构,使用单一权重集。为此,作者提出了一种混合 Query 策略,它能够有效地动态适应不同类型的目标,而无需启发式设计。此外,统一架构使作者能够使用带有合成 Mask 和标题的数据增强,以进一步提高模型的泛化能力。

2024-04-11 13:49:32 1025 1

原创 UltraLight VM-UNet:平行视觉 Mamba 显着减少皮肤病变分割参数

传统上,为了提高模型分割性能,大多数方法倾向于添加更复杂的模块。但这并不适用于医疗领域,尤其是在移动医疗设备上,由于计算资源限制,计算负担重的模型不适合真实的临床环境。最近,以Mamba为代表的状态空间模型(SSMs)成为传统卷积神经网络(CNNs)和Transformers的有力竞争者。在本文中,作者深入探讨了Mamba中参数影响的关键要素,并基于此提出了超轻量级视觉Mamba UNet(UltraLight VM-UNet)。

2024-04-11 13:38:05 1226

原创 A Note on LoRA

LoRA已成为一种首选的方法,用以高效地适应大型语言模型(LLM),其简便性和有效性令人瞩目。本文档扩展了原始LoRA论文,提供了最初未讨论的新视角,并展示了一系列在规模化部署LoRA时的见解。在不引入新实验的情况下,作者旨在提高对LoRA的理解和应用。

2024-04-10 22:56:29 890

原创 LDA的拓展方法

LDA的拓展方法基本拓展动态主题模型(Dynamic Topic Models)应用场景动态主题模型(Dynamic Topic Models,DTM)的工作步骤动态主题模型实现动态主题模型(Dynamic Topic Models,DTM)与Latent Dirichlet Allocation (LDA) 的区别基本拓展LDA(Latent Dirichlet Allocation)是一种常用的主题模型,用于从文本数据中发现隐藏的主题结构。基本的 LDA 方法将文档表示为主题的混合,每个主题都由词汇

2024-04-10 22:54:19 879

原创 RSMamba:基于状态空间模型的遥感图像分类

遥感图像分类构成了各种理解任务的基础,在遥感图像解释中起到了至关重要的作用。卷积神经网络(CNNs)和Transformers的最新进展显著提高了分类的准确度。然而,遥感场景分类依然是一个重大挑战,特别是考虑到遥感场景的复杂性和多样性以及时空分辨率的变化。全图像理解能力可以为场景识别提供更精确的语义线索。在本文中,作者介绍了RSMamba,一种新型的遥感图像分类架构。RSMamba基于状态空间模型(SSM),并融入了一种高效、硬件感知的设计,称为Mamba。

2024-04-09 10:24:27 941

原创 InsectMamba:基于状态空间模型的害虫分类

害虫分类是农业技术中的关键任务,对于确保食品安全和环境可持续性至关重要。然而,由于害虫具有高度的伪装性和物种多样性等因素,害虫识别的复杂性构成了重大障碍。现有方法在提取区分密切相关的害虫种类的细微特征方面存在困难。尽管近期的研究通过修改网络结构和结合深度学习方法提高了准确性,但由于害虫与其周围环境的相似性,挑战依然存在。

2024-04-09 10:15:08 781

原创 流式密集视频字幕

对于一个密集视频字幕生成模型,预测在视频中时间上定位的字幕,理想情况下应该能够处理长的输入视频,预测丰富、详细的文本描述,并且在处理完整个视频之前能够生成输出。然而,目前最先进的模型仅处理固定数量的降采样帧,并且在看完整个视频后做出一次完整的预测。我们提出了一种流式密集视频字幕生成模型,该模型包含两个创新组件:首先,我们提出了一种新的记忆模块,基于对传入令牌的聚类,该模块能够处理任意长度的视频,因为记忆的大小是固定的。其次,我们开发了一种流式解码算法,使我们的模型能够在处理完整个视频之前做出预测。

2024-04-08 13:36:08 1250

原创 T-Mamba:用于牙齿 3D CBCT 分割的频率增强门控长程依赖性

三维成像中的高效牙齿分割对于正畸诊断至关重要,但由于CBCT图像中的噪声、低对比度和伪影,这仍然是一个挑战。卷积神经网络(CNNs)和变压器(transformers)都已成为图像分割中流行的架构。然而,由于内在的局部性或计算复杂性,它们在处理长距离依赖方面的有效性受到限制。为了解决这个问题,我们提出了T-Mamba,将共享位置编码和基于频率的特征整合到视觉Mamba中,以解决空间位置保留和频率域特征增强的限制。此外,我们还设计了一个门选择单元,以自适应地整合空间域中的两个特征和频率域中的一个特征。

2024-04-08 13:31:54 658

原创 LLM是优秀的手语翻译者

基于观察,我们发现LLMs可以通过利用与之前学习过的语言的共有特性来有效处理新语言。因此,我们旨在引入一些设计,将这些签名视频转换为对LLMs可读和友好的类语言格式。具体而言,我们假设向LLM提供签名视频的语言式表征可以改善LLM对签名视频的理解,并促进对之前学习过的语言的共有特性的更大利用,从而使得LLM在SLT(手语到语音翻译)性能上取得更好的表现。

2024-04-07 22:07:22 739

原创 AGILEFORMER:用于医学图像分割的空间敏捷 Transformer UNET

在过去的几十年中,深度神经网络,尤其是卷积神经网络,已经在各种医学图像分割任务中取得了最先进的表现。近年来,视觉Transformer(ViT)的引入显著改变了深度分割模型的格局。由于它们出色的性能和可扩展性,对ViTs的关注日益增加。然而,我们认为目前基于视觉Transformer的UNet(ViT-UNet)分割模型的设计可能无法有效地处理医学图像分割任务中感兴趣对象的异质外观(例如,不同的形状和大小)。为了应对这一挑战,我们提出了一种结构化的方法,将空间动态组件引入到ViT-UNet中。

2024-04-07 22:03:12 987

原创 CLoVe:在对比视觉语言模型中编码组合语言

近年来,视觉与语言任务的性能显著提高。基础视觉-语言模型(VLMs),如CLIP,已在多种场景中得到应用,并在多项任务中展现出卓越的性能。这些模型擅长以目标为中心的识别,但学习到的文本表示对词序似乎是不变的,无法以新颖方式组合已知概念。然而,目前没有证据表明任何VLM,包括大规模的单流模型如GPT-4V,能够成功地识别组合。在本文中,作者引入了一个框架,可以显著提高现有模型编码组合语言的能力,在组合性基准测试上实现了超过10%的绝对改进,同时在标准的目标识别和检索基准测试上保持或提高性能。

2024-04-06 14:47:32 764

原创 用于超声图像中的乳腺病变分割的全局指导网络

超声中的自动乳腺病变分割有助于诊断乳腺癌,这是影响全球女性的可怕疾病之一。由于乳腺超声图像固有的斑点伪影、模糊的乳腺病变边界以及乳腺病变区域内的不均匀强度分布,从超声图像中准确分割乳腺区域是一项具有挑战性的任务。最近,卷积神经网络(CNN)在医学图像分割任务中表现出了显着的效果。然而,CNN中的卷积操作通常集中在局部区域,这些局部区域在捕获输入超声图像的长程依赖性方面能力有限,从而导致乳房病变分割准确性下降。

2024-04-06 14:28:38 736

原创 深度学习的发展历史与关键技术

在未来,随着计算机算力的增强、数据规模的扩大以及算法的不断优化,深度学习技术将会在更多领域展现出强大的应用潜力,为人类社会带来更多的便利与进步。它由一个输入层和一个输出层组成,其中每个输入都与输出层的每个神经元相连,具有一定的权重。感知机的输出是输入的加权和经过阈值函数的结果。本文将介绍深度学习的发展历史,从早期的感知机到如今的深度神经网络,同时介绍深度学习中的一些关键技术和公式。反向传播算法是用于计算神经网络模型中参数梯度的方法,通过链式法则将输出层的误差逐层向前传播,从而计算出每一层的参数梯度。

2024-04-05 14:54:59 1049

原创 人脸识别的经典深度学习方法

基于深度学习的人脸识别方法通常包括两个步骤:首先使用一个深度神经网络模型提取人脸图像的特征向量,然后使用一种距离度量方法(如欧氏距离、余弦相似度等)来比较特征向量之间的相似度,从而实现人脸识别。例如,使用CNN模型进行端到端的人脸检测,可以直接从原始图像中提取人脸区域,避免了手工设计特征的过程,提高了检测的准确率和鲁棒性。基于特征点的对齐方法通过检测人脸图像中的关键特征点(如眼睛、鼻子、嘴巴等),然后根据这些特征点的位置调整人脸图像的姿态和位置。常见的人脸对齐方法包括基于特征点的对齐和基于深度学习的对齐。

2024-04-05 14:46:18 1224

OASBUD数据读取代码

OASBUD数据只提供了一个.mat文件,想要使用这个数据集,需要将原始数据读取为图像,这里是数据读取的代码示例

2024-03-25

BUSIS数据集申请书-Word和PDF版本

官方申请书只有PDF版本,但是使用的时候要求姓名打印,其他信息手写,再拍照上传,下载之后就可以直接填名字打印了

2024-03-25

2023蓝桥杯C++A组省赛真题+题目解析+测试地址

资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。资源里面不仅有题目,还有对每道题目的解答和思路,更是有可以让你自己去测试实力的测试地址。2023蓝桥杯C++A组省赛真题+题目解析+测试地址。

2024-03-22

2023蓝桥杯Java组B卷及答题地址.zip

2023蓝桥杯Java组B卷及答题地址

2024-03-20

2023蓝桥杯Java组G卷及答题地址.zip

2023蓝桥杯Java组G卷及答题地址 2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址2023蓝桥杯Java组G卷及答题地址

2024-03-20

2023蓝桥杯Java组C卷及答题地址.zip

2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址2023蓝桥杯Java组C卷及答题地址

2024-03-20

2023蓝桥杯Java组A卷及答题地址.zip

2023蓝桥杯Java组A卷及答题地址

2024-03-20

2023蓝桥杯C组G卷及答题地址.zip

2023蓝桥杯C组G卷及答题地址

2024-03-20

2023蓝桥杯G组C卷及答题地址.zip

2023蓝桥杯G组C卷及答题地址

2024-03-20

2023蓝桥杯C组B卷及答题地址.zip

2023蓝桥杯C组B卷及答题地址

2024-03-20

2023蓝桥杯C组A卷及答题地址

2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023蓝桥杯C组A卷及答题地址2023

2024-03-20

第十届蓝桥杯大赛决赛真题-c赛道和JAVA赛道所有真题

第十届蓝桥杯大赛决赛真题-c赛道和JAVA赛道所有真题-分门别类,都整理好啦

2024-03-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除