自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4138)
  • 资源 (2)
  • 收藏
  • 关注

原创 【荐读IEEE TPAMI】深度卷积神经网络的结构化剪枝:综述

深度卷积神经网络(CNNs)的卓越性能通常归因于它们更深更宽的架构,这可能会带来显著的计算成本。因此,修剪神经网络已经引起了人们的兴趣,因为它有效地降低了存储和计算成本。与导致非结构化模型的权重修剪不同,结构化修剪提供了通过产生对硬件实现友好的模型来实现现实加速的好处。结构化修剪的特殊要求导致了众多新挑战的发现和创新解决方案的开发。本文综述了深度CNNs结构化修剪的最新进展。我们总结了并比较了最先进的结构化修剪技术,这些技术涉及滤波器排序方法、正则化方法、动态执行、神经架构搜索、彩票假设以及修剪的应用。

2024-05-24 06:38:30 158

原创 【荐读IEEE TPAMI】DeepM2M2CDL:深度多尺度多模态卷积字典学习网络

作者:Xin Deng; Jingyi Xu; Fangyuan Gao; Xiancheng Sun; Mai Xu源码链接: https://github.com/JingyiXu404/TPAMI-DeepM2CDL对于多模态图像处理,由于模态间的复杂依赖性,网络的可解释性至关重要。最近,一个有前景的研究方向是通过展开策略将字典学习整合到深度学习中,以实现可解释的网络。然而,现有的多模态字典学习模型都是单层和单尺度的,这限制了其表示能力。在本文中,我们首先介绍了一个多尺度多模态卷积字典学习(M2CDL

2024-05-22 22:30:00 1429

原创 【荐读 IEEE TRO】深度卷积神经网络的结构化剪枝综述

题目:[Structured Pruning for Deep Convolutional Neural Networks: A Survey (https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10330640)深度卷积神经网络的结构化剪枝综述作者:Yang He;Lingao Xiao摘要深度卷积神经网络(CNNs)的显著性能通常归因于其更深和更宽的架构,但这也带来了显著的计算成本。因此,剪枝神经网络引起了广泛关注,因为它

2024-05-22 19:30:00 817

原创 【荐读IEEE TPAMI】Growing Like a Tree: 从图骨架树中识别主干

作者:Zhongyu Huang; Yingheng Wang; Chaozhuo Li; Huiguang He源码:https://github.com/zhongyu1998/GTR图神经网络(GNNs)多年来一直以消息传递范式为基础,在广泛的应用领域取得了巨大成功。尽管这一范式具有优雅性,但它为图级任务带来了几个意想不到的挑战,例如长距离问题、信息瓶颈、过度压缩现象和有限的表达能力。在本研究中,我们旨在克服这些主要挑战,并打破图级任务中传统的“节点和边中心”思维模式。为此,我们从信息影响的角度对信

2024-05-21 20:30:00 652

原创 【荐读 IEEE TPAMI】Bi-DexHands: 迈向人类水平的双手灵巧操控

实现机器人在灵巧操控方面的人类水平仍然是一个关键的开放问题。即使是简单的灵巧操控任务,由于自由度的高数量和异构代理(例如,手指关节)之间合作的需求,也带来了显著的困难。尽管一些研究人员已经利用强化学习(RL)来控制单手操控物体,但需要双手协调合作的任务仍然未被充分探索,因为适合的环境较少,这可能导致困难和次优性能。为了应对这些挑战,我们介绍了Bi-DexHands,这是一个具有两只灵巧手的模拟器,包含20个双手操控任务和数千个目标对象,旨在基于认知科学研究匹配不同水平的人类运动技能。

2024-05-21 19:30:00 669

原创 【荐读IEEE TPAMI】Anti-UAV410: 一种用于野外追踪无人机的热红外基准测试与定制化方案

无人机(Unmanned Aerial Vehicles,UAVs),也称为无人飞行器,在红外视频中的感知对于有效的反无人机任务至关重要。然而,现有的无人机跟踪数据集在目标尺寸和属性分布特征方面存在局限性,无法完全代表复杂的现实场景。为了解决这个问题,我们引入了一个名为Anti-UAV410的通用红外无人机跟踪基准。该基准包含总共410个视频,超过438 K个手动注释的边界框。为了应对复杂环境中无人机跟踪的挑战,我们提出了一种新的方法,称为孪生无人机跟踪器(SiamDT)。

2024-05-20 21:45:00 1115

原创 【荐读 IEEE TPAMI】一种灵活的EM类噪声数据聚类算法

作者:Violeta Roizman; Matthieu Jonckheere; Frédéric Pascal尽管非常流行,但众所周知,高斯混合模型(Gaussian mixture model)的期望最大化(Expectation-Maximization,EM)算法在处理非高斯分布或存在异常值或噪声时表现不佳。在本文中,我们提出了一种灵活的类EM聚类算法(Flexible EM-like Clustering Algorithm,FEMCA):设计了一种新的聚类算法,遵循EM过程。它基于对聚类中心和协

2024-05-20 19:15:00 913

原创 【荐读IEEE TPAMI】用于快速视图合成的级联和通用化的神经辐射场

我们提出了一种级联和可泛化的神经辐射场方法,用于视图合成。最近的泛化视图合成方法可以使用一组附近的输入视图渲染高质量的新视图。然而,由于神经辐射场的均匀点采样特性,渲染速度仍然很慢。现有的特定场景方法可以有效地训练和渲染新视图,但不能泛化到未见过的数据。我们的方法通过提出两个新颖的模块来解决快速和泛化视图合成的问题:一个粗略的辐射场预测器和一个基于卷积的神经渲染器。该架构基于隐式神经场推断一致的场景几何,并使用单个GPU高效渲染新视图。

2024-05-19 20:00:00 829

原创 【荐读IJCV】基于自适应递归网络的少样本立体匹配算法及其高领域适应性

基于深度学习的立体匹配算法因其在机器人视觉和自动驾驶等领域的优异表现而得到了广泛的研究。然而,这些算法需要大量的标记数据进行训练,并面临领域适应性不足的问题,这限制了它们的应用性和灵活性。本文针对这两个缺陷,提出了一个少样本训练的立体匹配模型,具有高领域适应性。在模型中,立体匹配被构建为在可能的解空间中的动态优化问题,并提出了一种多尺度匹配成本计算方法,以获得应用场景的可能解空间。此外,设计了一个自适应递归的3D卷积神经网络,以从可能的解空间中确定最优解。

2024-05-19 19:45:00 715

原创 【荐读 IEEE IJCV】基于并行卡尔曼滤波器的高效通用GPU多目标跟踪方法

基于均匀假设的卡尔曼滤波器一直是跟踪器中关键的运动估计模块。然而,当应用于大规模目标跟踪场景时,它在非均匀运动建模和计算效率方面存在局限性。为了解决这些问题,我们提出了一种新颖的并行卡尔曼滤波器(PKF),它简化了传统的状态变量,以减少计算负载并实现有效的非均匀建模。在PKF中,我们提出了一种非均匀公式,通过将时间间隔Δt从常量转换为与位移相关的变量来模拟非均匀运动,并将减速策略纳入公式的控制输入模型中,以解决多目标跟踪(MOT)中的逃逸问题;

2024-05-18 19:45:00 783

原创 【荐读IEEE TPAMI】基于模型的强化学习与独立想象力

在基于视觉的交互系统中,世界模型学习行动的后果。然而,在实际场景中,如自动驾驶,存在不可控制的动态,这些动态独立于或与行动信号稀疏相关,这使得学习有效的世界模型变得具有挑战性。为了解决这个问题,我们提出了Iso-Dream++,这是一种基于模型的强化学习方法,具有两个主要贡献。首先,我们优化了逆动力学,鼓励世界模型从环境混合的时空变化中隔离出可控制的状态转换。其次,我们基于解耦的潜在想象进行策略优化,我们将不可控制的状态滚动到未来,并将其与当前可控制的状态自适应地关联起来。

2024-05-18 19:15:00 937

转载 【荐读IEEE TPAMI】图神经网络的并行与分布式执行:深入并发性分析

点击上方“PaperEveryday”,选择加"星标"或“置顶”顶会论文解读,第一时间分享题目:Parallel and Distributed Graph Neural Networks: An In-Depth Concurrency Analysis图神经网络的并行与分布式执行:深入并发性分析作者:Maciej Besta 和 Torsten Hoefler摘要图神经网络(GNNs)是深度学习...

2024-05-16 10:05:59 6

转载 一文了解人形机器人产业沿革及进展

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达2023年5月特斯拉展示了Tesla Bot人形机器人“擎天柱”( Optimus )的全新型号。该款人形机器人不仅会模仿人类动作,还可以完成物品分类、抓力控制等更复杂的任务。该款人形机器人结合了特斯拉的AI技术,即基于视觉神经网络神经系统预测能力的自动驾驶技术,具有极强算力的DOJO D1超级计算机芯片,Dojo 架构拥有一个...

2024-05-16 10:05:59 9

转载 【荐读IEEE TPAMI】DNA家族:利用块级监督策略增强权重共享的神经网络架构搜索...

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达DNA Family: Boosting Weight-Sharing NAS With Block-Wise Supervisions题目:DNA家族:利用块级监督策略增强权重共享的神经网络架构搜索作者:Guangrun Wang , Member, IEEE, Changlin Li , Liuchun Yuan, Jief...

2024-05-15 10:05:39 7

转载 今年,扩散模型还有什么可做的方向?

通往AGI之路,扩散模型强势登场,突破了以往模型限制,如VAEs的后验分布对齐问题、GANs的不稳定性等,凭借逼真的生成样本能力,席卷CV、NLP、多模态学习等研究领域,相关论文层出不穷,其中,大热的两篇研究综述,全面梳理了扩散模型基础、算法到应用,看完即入门,涌现超多idea!继上周好评的综述直播课,研梦非凡5月17日邀请了大模型资深算法工程师魏导师,为大家独家详解另一篇综述:《扩散模型综述—方...

2024-05-15 10:05:39 14

转载 实操教程|使用图像分割来做缺陷检测的一个例子

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨Vinithavn来源丨AI公园1. 介绍什么是物体检测?给定一张图像,我们人类可以识别图像中的物体。例如,我们可以检测图像中是否有汽车,树木,人等。如果我们可以分析图像并检测物体,我们可以教机器做同样的事情吗?答案是肯定的。随着深度学习和计算机视觉的兴起,我们可以实现目标检测的自动化。我们可以建立深度学习和计算机视觉模...

2024-05-15 10:05:39 12

转载 坏了,我的RTX 3090 GPU在对我唱歌!

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达机器之心编辑部这你敢信?!在一个昏暗的机箱里,一台 RTX 3090 GPU「唱」着经典英语儿歌《一闪一闪亮晶晶》(Twinkle,Twinkle,Little Star)的旋律。这不是灵异事件,也不是科幻电影,而是一位 AI 科学家在「整活」。这位科学家名叫 Vrushank Desai。据他介绍,机箱中的旋律是由 GPU 的...

2024-05-14 10:05:50 8

转载 三维目标检测之ROS可视化

1. 思路通过ros来实现点云消息的订阅和检测框bbox消息的发布,来实现一个检测效果的可视化功能。2. 实验环境Ubuntu16.04cuda 10.1ros-kinetic检测环境主要依托OpenPCDet,环境搭建可参考我的这篇博客3. 步骤1. 前提条件已经搭建过了OpenPCDet。已经搭建了ROS环境,我用的是kinetic版本,用其他版本应该也可以。2. 编译环境创建一个工作空间并进...

2024-05-14 10:05:50 11

转载 【荐读IEEE TPAMI】关于部分标签学习平均损失的鲁棒性

点击上方“计算机书童”,选择加"星标"或“置顶”顶会论文解读,第一时间分题目:On the Robustness of Average Losses for Partial-Label Learning关于部分标签学习平均损失的鲁棒性作者:Jiaqi Lv; Biao Liu; Gang Niu; LeiFeng ,NingXu; XinGeng; MiaoXu; BoAn; Masashi Su...

2024-05-14 10:05:50 7

转载 性能超Transformer!Mamba系列论文整理分享

Mamba01Mamba作为一种新型的选择性状态空间模型方法,在语言建模方面可以媲美Transformer,并且目前已经有了很多结合Mamba的研究成果。那么,今天我就整理了Mamba经典论文+Mamba大模型/遥感/医学/综述等论文合集。论文合集获取方式如下:添加课程回复"Mamba"01.Mamba: Linear-Time Sequence Modeling with Selective S...

2024-05-14 10:05:50 15

原创 【荐读 IEEE TPAMI】DNA Family_ Boosting Weight-Sharing NAS With Block-Wise Supervisions

神经架构搜索(NAS)旨在通过机器自动设计神经架构,被认为是自动机器学习的关键步骤。其中一类值得注意的NAS方法是权重共享NAS,它显著提高了搜索效率,并允许NAS算法在普通计算机上运行。尽管备受期待,但这类方法在搜索有效性上存在不足。通过使用泛化界限工具,我们展示了导致这一缺点的原因是潜在的不可靠架构评分,这是由于可能架构的搜索空间过大造成的。为了解决这个问题,我们将一个大型搜索空间模块化为具有较小搜索空间的块,并开发了一组使用蒸馏神经架构(DNA)技术的模型。

2024-05-13 12:32:34 603 1

原创 【荐读 IEEE TPAMI】Parallel and Distributed Graph Neural Networks_ An In-Depth Concurrency Analysis

图神经网络(GNNs)是深度学习中最强大的工具之一。它们通常在无结构网络上解决复杂问题,如节点分类、图分类或链接预测,准确度很高。然而,GNNs 的推理和训练都很复杂,并且它们独特地结合了不规则图处理的特征与密集和规则计算。这种复杂性使得在现代大规模并行架构上有效执行 GNNs 变得非常具有挑战性。为了缓解这个问题,我们首先设计了一个 GNNs 中并行性的分类法,考虑了数据和模型并行性以及不同形式的流水线处理。

2024-05-13 12:31:17 681

原创 【荐读 IEEE TPAMI】CADC++_ Advanced Consensus-Aware Dynamic Convolution for Co-Salient Object Detection

在给定一组相关图像进行共同显著对象检测(Co-SOD)时,人类首先从整个组中总结共识线索,然后在每张图像中搜索共同显著对象。大多数先前的方法在总结阶段没有考虑鲁棒性、可扩展性或稳定性,并在搜索阶段采用简单的融合策略来融合共识和图像特征。我们的工作提出了一种新颖的共识感知动态卷积(CADC)模型,直接从“总结和搜索”的角度出发,明确有效地执行Co-SOD。在总结阶段,我们通过池化方法提取鲁棒的个体图像特征,并通过自注意力将它们整合以生成共识特征,从而建模可扩展性和稳定性。

2024-05-13 12:29:06 682

原创 【荐读IEEE TPAMI】通过摄像机选择重新识别个人

题目:Revisiting Person Re-Identification by Camera Selection通过摄像机选择重新识别个人作者:Yi-Xing Peng; Yuanxun Li; Wei-Shi Zheng摘要行人重识别(Person Re-ID)是视觉监控中的一个基础任务。给定目标人物的查询图像,传统的Re-ID专注于候选图像与查询图像之间的成对相似性。然而,传统Re-ID并未评估检索结果的一致性,即排名最前的图像是否包含同一个人,这在某些应用中是有风险的,例如遗漏了患者经过

2024-05-13 12:26:48 256

原创 【荐读IEEE TPAMI】无监督去雨:非对称对比学习与自相似性相遇

大多数现有的基于学习的去雨方法都是在合成的雨-清洁对上进行有监督训练的。合成雨与真实雨之间的领域差距使它们在复杂的真实雨场景中的泛化能力降低。此外,现有方法主要独立利用图像或雨层的属性,很少有方法考虑它们之间的相互排斥关系。为了解决这一困境,我们探索了每层内部的内在自相似性以及两层之间的相互排斥性,并提出了一种无监督的非局部对比学习(NLCL)去雨方法。非局部自相似性图像块作为正样本被紧密地拉在一起,而雨块作为负样本则被显著地推开,反之亦然。

2024-05-13 12:24:06 632

原创 【荐读IEEE TRO】通过仿生优化提高仿生机器人肘-前臂系统的性能

本文详细阐述了一种创新的机器人肘-前臂系统设计的制定和验证,该系统模仿了人类肌肉骨骼系统的复杂生物力学。传统的机器人模型常常低估了软组织的重要功能,软组织在紧凑性、安全性、稳定性和运动范围之间提供了折衷。与之相反,本研究提出了一个全面的生物关节复制,包括骨骼、软骨、韧带和肌腱,最终形成了一个仿生机器人。研究强调了人类肘部和前臂的结构紧凑和稳定性,这归功于三骨框架和多样化的软组织。该方法涉及对人体解剖学的全面检查,其次是对软组织对原型机器人肘-前臂系统稳定性贡献的理论探索。

2024-05-13 12:21:39 667

原创 【荐读IEEE TPAMI】超快速深度车道检测与混合锚驱动序数分类

现代方法主要将车道检测视为像素级分割问题,这在解决效率和具有挑战性场景(如严重遮挡和极端光照条件)的问题上存在困难。受人类感知的启发,我们在严重遮挡和极端光照条件下识别车道主要依赖于上下文和全局信息。基于这一观察,我们提出了一种新颖、简单但有效的公式,旨在实现超快速度和解决具有挑战性场景的问题。具体来说,我们将车道检测过程视为一个使用全局特征的锚驱动序数分类问题。首先,我们使用一系列混合(行和列)锚上的稀疏坐标来表示车道。借助锚驱动的表示,我们随后将车道检测任务重新构建为序数分类问题以获取车道的坐标。

2024-05-13 12:18:47 776

原创 【荐读IEEE TPAMI】领域内GAN反演:用于精确重建和可编辑性

生成对抗网络(GANs)通过将随机采样的潜在代码映射到高保真合成图像,显著推进了图像合成技术。然而,将训练良好的GAN应用于真实图像编辑仍然具有挑战性。一个常见的解决方案是找到一个近似的潜在代码,能够充分恢复输入图像以进行编辑,这也被称为GAN反演。为了反演GAN模型,先前的工作通常专注于在像素级重建目标图像,但很少有研究涉及反演结果是否能够很好地支持语义级别的操作。

2024-05-13 12:15:18 1003

原创 【荐读IEEE TPAMI】神经重建:从单目视频中实时连贯的3D场景重建

我们提出了一个名为 NeuralRecon 的新框架,用于从单目视频中实时重建三维场景。与先前的方法不同,先前的方法在每个关键帧上分别估计单视图深度图,然后将其融合,我们提出直接通过神经网络顺序地重建每个视频片段的局部表面,表示为稀疏的 TSDF 体积。使用基于门控循环单元(Gated Recurrent Units, GRU)的学习型 TSDF 融合模块来指导网络从先前的片段中融合特征。这种设计允许网络在顺序重建表面时捕获局部平滑先验和全局形状先验,从而实现准确、连贯和实时的表面重建。

2024-05-13 12:11:47 654

转载 月薪已炒到15w?真心建议大家冲一冲新兴领域,工资高前景好,人才缺口极大!...

近期,裁员的公司越来越多今天想和大家聊聊职场人的新出路。作为席卷全球的新概念ESG已然成为当前各个行业关注的最热风口目前,国内官方发布了一项ESG新证书含金量五颗星、中文ESG证书、完整ESG考试体系、名师主讲...而ESG又是与人力资源直接相关甚至在行业圈内成为大佬们的热门话题...当前行业下行,裁员的公司也越来越多大家还是冲一冲这个新兴领域01 ESG为什么重要?在双碳的大背景下,ESG已然成...

2024-05-13 10:05:28 4

转载 使用注意力机制来做医学图像分割的Pytorch实现

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:Léo Fillioux编译:ronghuaiyang导读对两篇近期的使用注意力机制进行分割的文章进行了分析,并给出了简单的Pytorch实现。从自然语言处理开始,到最近的计算机视觉任务,注意力机制一直是深度学习研究中最热门的领域之一。在这篇文章中,我们将集中讨论注意力是如何影响医学图像分割的最新架构的。为此,我们将描述最...

2024-05-13 10:05:28 14

转载 人群计数、行人检测等开源数据集资源汇总

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编辑丨极市平台极市导读本文收集总结了一些行人检测、人群计数相关的开源数据集资源,均附有下载链接。SCUT FIR行人检测数据集数据集下载地址:https://sourl.cn/4VK3BnSCUT FIR Pedestrian Datasets 是一个大型远红外行人检测数据集。它由大约 11 小时长的图像序列( 帧)组成,速...

2024-05-13 10:05:28 12

原创 【荐读IEEE TPAMI】对联合学习中对抗性攻击的影响:一项调查

联合学习(FL)已经出现作为一种强大的机器学习技术,它允许从分散的数据源开发模型。然而,FL的分散性质使其容易受到对抗性攻击的影响。在这项调查中,我们通过涵盖攻击预算、可见性、泛化能力等多个方面,全面概述了恶意攻击对FL的影响。以往的调查主要集中在多种类型的攻击和防御上,但没有考虑这些攻击在预算、可见性和泛化能力方面的冲击。本调查旨在通过识别具有低预算、低可见性和高影响的FL攻击来填补这一空白。此外,我们讨论了FL领域对抗性防御的最新进展,并强调了保护FL的挑战。

2024-05-12 17:50:33 809

转载 目标检测 | 基于统计自适应线性回归的目标尺寸预测

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:Edison_GYOLOv2和YOLOv3是典型的基于深度学习的目标检测算法,它们使用统计自适应指数回归模型设计了网络的最后一层来预测目标的尺寸大小。一、简要今天分享的是研究者提出了基于统计自适应线性回归的目标尺寸预测方法。YOLOv2和YOLOv3是典型的基于深度学习的对象检测算法,它们使用统计自适应指数回归模型设计了网...

2024-05-12 10:06:25 13

转载 强化学习博士生的毕业感想!

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达今天逛知乎看到了一篇中科大博士关于强化学习方向的感想,回想18年参加南大周志华组的面试时,那会强化学习非常火,俞扬老师上来就让我解读DQN论文的经历还历历在目,后来入了NLP的坑,再读这篇文章时真的感同身受,下面让我们一起进入作者的视角,来看看他的感悟吧~作者:赵鉴| 编辑:对白的算法屋https://zhuanlan.zhi...

2024-05-12 10:06:25 7

转载 人工智能的第一性原理是什么?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:郭平,北师大学图象处理研究中心主任来源:清湛人工智能研究院、图灵人工智能这篇文章是郭平教授的一篇文章,本文采用“四问”的表述方式,解释了人工智能的第一性原理。提出了在基于物理的人工智能基础研究领域,运用第一性原理思维解决人工智能缺乏基础自然科学常识的一种思路;并建议将最小作用量原理作为人工智能的第一性原理。实现通用人工智能...

2024-05-12 10:06:25 5

转载 师兄跟我说他博士毕业后想回老家县城工作

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达转自:量子位|编辑:Jack Cui大家好,我是对白。我有个师兄目前在上海某985高校读博,即将毕业,前几天唠嗑他说想毕业后回老家县城工作。我就想起来以前在量子位上看到的一篇文章了,于是就把那篇文章给他发过去了,今天分享一下。我刚毕业那会儿,就知道深圳中小学教师岗位工资高。当时就考虑过,要不要去,有编年薪 30 万,真香。后...

2024-05-11 10:05:32 11

转载 实践教程|源码级理解Pytorch中的Dataset和DataLoader

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言本文30分钟带你达到对Pytorch中的Dataset和DataLoader的源码级理解,并提供构建数据管道的3种常用方式的范例,扫除你构建数据管道的一切障碍。作者:梁云1991来源:算法美食屋仅用于学术分享,若侵权请联系删除朋友,你还在为构建Pytorch中的数据管道而烦扰吗?你是否有遇到过一些复杂的数据集需要设计自定义...

2024-05-11 10:05:32 14

转载 轻量级MobileSAM:比FastSAM快4倍,处理一张图像仅需10ms(附源代码)

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达论文地址:https://arxiv.org/pdf/2306.14289.pdf代码地址:https://github.com/ChaoningZhang/MobileSAM今天分享研究了通用的零样本分割,在不需要任何训练样本的情况下,实现新类别的全景、实例和语义分割。01概要简介SAM是一种prompt-guided的视觉基...

2024-05-10 10:05:13 14

转载 少样本学习综述:技术、算法和模型

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题。FSL的全部意义在于让机器学习模型能够用一点点数据学习新东西,这在收集一堆标记数据太昂贵、花费太长时间或不实用的情况下非常有用。作者:Christophe Atten来源:DeepHub IMBA仅用于学术分享,若侵权请联系删除少样本...

2024-05-10 10:05:13 20

Python视觉实战项目31讲.pdf

本手册中主要涉及以下几部分,首先是对 OpenCV中自带的基本函数进行介绍。其次是OpenCV的实战项目,一方面是基于实际项目利用OpenCV实现特定对象的检测,例如车道线检测、路面的坑洼检测、等;另一方面是基于OpenCV实现图像增强,例如利用OpenCV消除运动所引起的图像模糊等。最后是OpenCV与深度学习等其他相结合实现图像分割、人脸检测、运动检测等难度较大的问题。

2020-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除