自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 (CVPR) CNN融合注意力机制,起飞起飞!

本文的主要研究方法是探索卷积(Convolution)和自注意力(Self-Attention)之间的内在联系,并基于这种联系提出了一种新的混合模型ACmix(Attention and Convolution mix),以实现两者的有效集成。ACmix模块通过共享第一阶段的1×1卷积操作,有效地减少了重复计算,并在第二阶段引入了轻量级的特征聚合操作,从而在保持计算效率的同时,充分利用了卷积和自注意力的优势。图中分为三个部分,分别展示了传统卷积模块、自注意力模块和 ACmix 模块的结构和计算过程。

2025-10-08 17:10:43 381

原创 100K*15薪!CV的薪资杀疯了!!!

【摘要】计算机视觉成为AI领域竞争最激烈的方向,企业高薪招聘相关人才,月薪最高达110K。为帮助求职者系统掌握深度学习核心技术,唐宇迪团队推出《人工智能深度学习涨薪就业班》(第13期),课程对标大厂P7+标准,包含450+课时、200+实战案例及30+应用场景,新增YoLov12/v13、多模态等前沿技术。课程提供一对一学习规划、技术答疑、就业内推等服务,助力学员实现年薪40W-60W+目标。

2025-09-29 18:54:50 488

原创 「YOLO+1」的游戏循环被打破?最新YOLO26出炉,端到端架构重塑实时检测新范式!

YOLO26是YOLO系列最新边缘优化模型,采用端到端设计,移除了DFL和NMS模块,简化部署流程并提升CPU推理速度达43%。创新性引入MuSGD优化器,融合SGD与Muon技术,显著提升训练效率。该模型支持检测、分割、分类等五大任务,特别优化小目标识别能力,为边缘设备提供"即下即用"解决方案。目前仍处开发阶段,最终性能指标将在正式发布时公布。

2025-09-27 18:00:47 1084

原创 郑教授最新力作,构建多模态跨领域知识融合新范式(附论文)

本文提出了一种跨领域多模态数据知识融合框架,用于解决物理世界中的复杂问题。针对现有研究多聚焦单领域融合的局限,作者构建了包含领域层、链接层、模型层和数据层的四层架构,系统回答了“融合什么、为何能融合、如何融合”三个关键问题。论文创新性地提出了多视角、相似性、依赖性和共性四大知识对齐原则,并区分了精细与粗糙两种知识融合范式。该框架能有效整合不同领域的数据资源,已在空气质量预测、城市规划等场景验证了其价值。这项工作为跨域知识融合提供了系统化的方法论指导,对推动AI在物理世界的应用具有重要意义。

2025-09-26 17:44:05 971

原创 万字长文!从 0 到 1 搭建基于 LangGraph 的 AI Agent

在本节课中,我们成功将传统手搓 Agent 流程迁移到了 LangGraph 框架中,通过节点(Node)、边(Edge)和条件(Conditional Edge)构建出一个结构清晰、逻辑闭环的智能体流程图。所有对话状态被统一封装在 AgentState 中,实现了消息上下文的自动累积;工具调用与模型推理被分离为专职节点,大大提升了流程的可控性与可扩展性。同时,通过 model.bind_tools(),我们实现了模型自动识别何时该调用工具(如博查搜索),真正迈入了“让大模型主动思考再行动”的智能体范式。

2025-09-25 15:50:34 1149

原创 入门Kaggle竞赛看这一篇就够了!四大赛区的Kaggle竞赛分别适合哪些学生?

Kaggle是全球最大数据科学竞赛平台,由Google运营,提供四大类赛事:入门级(Getting Started)、进阶级(Playground)、商业级(Featured)和研究级(Research)。适合对数据科学感兴趣的高中生及大学生参与,可3-5人组队线上参赛,排名动态变化。获奖记录显示在个人主页,可作为申请大学或工作的有力证明。Kaggle还提供免费学习资源,帮助学生提升编程和数据分析能力。

2025-09-24 18:01:40 2998

原创 时隔8年,AI女神李飞飞团队CS231N计算机视觉课程来了!

摘要:斯坦福大学2025版CS231N计算机视觉课程正式上线,由李飞飞团队主讲,更新了16-17版8年前的课程内容。新版课程包含18讲内容,涵盖深度学习架构、CNN、RNN、Transformer等前沿技术,以及目标检测、三维视觉等应用领域。课程提供实践项目,帮助学生掌握深度学习工具集和工程技巧。

2025-09-23 19:08:44 541

原创 终于把神经网络算法搞懂了!!!

神经网络是一种模仿人脑神经元结构的机器学习算法,通过分层连接的节点(输入层、隐藏层和输出层)进行数据处理。其核心机制包括加权求和和激活函数(如Sigmoid、ReLU),通过前向传播和反向传播(梯度下降)不断优化权重参数。文中以鸢尾花分类为例,展示了标准化数据、训练模型(MLPClassifier)、评估准确率及可视化决策边界的完整流程。该模型可应用于图像识别、自然语言处理等领域,配套学习路线还能帮助快速掌握AI技术并应用于科研竞赛。

2025-09-22 21:26:02 683

原创 最新kaggle赛题!助你顺利拿下大厂Offer

Kaggle竞赛是提升数据分析能力的绝佳平台,适合学生、学者及职场人士。对初学者而言,能快速积累实战经验;研究者可从中获取论文灵感;求职者能丰富简历,掌握工业级解决方案;在职人员则可针对性提升技能。各类赛题覆盖多领域,参赛门槛低,组队参赛还能锻炼协作能力。立即扫码咨询,开启你的Kaggle进阶之路!

2025-09-20 16:39:37 297

原创 大模型如何让机器人实现“从冰箱里拿一瓶可乐”?

摘要:大模型正推动具身智能系统从"程序执行者"向"环境思考者"进化。在感知层,大模型通过多模态融合处理语音、视觉等环境信息;在控制层,基于深度强化学习实现路径规划和动作优化;在反馈层,能动态调整策略并与人交互。其突破性体现在:1)端到端处理复杂自然语言指令;2)多模态环境感知能力;3)实时运动控制与任务分解。当前面临实时性、算力消耗等挑战,但在医疗、航天等领域展现应用潜力。该技术使机器人具备类人思考能力,实现从机械执行到智能决策的跨越。

2025-09-19 18:07:21 1099

原创 一节课带你杀入Kaggle Top 1%!

摘要: Kaggle竞赛是连接机器学习理论与实战的桥梁,相比完美数据集,它提供更接近真实业务场景的挑战。适合学生、求职者和在职者通过参赛积累经验、提升履历。课程【如何用Kaggle实现学业与职业跃迁】由Kaggle大师B老师主讲,涵盖竞赛认知、价值解析及实战指导,助力学员从入门到获奖。9月18日开营,提供直播授课+资料+答疑服务,并推荐热门赛题组队机会。

2025-09-18 18:20:57 738

原创 让机器人读懂情感?30+篇顶会论文探索多模态情感分析

本文介绍了AI情感识别在自然交互场景中的应用需求与挑战,指出多模态分析是提升识别精度的有效方法。

2025-09-17 17:58:21 309

原创 AI零基础进大厂,挑战年薪40-60W+

程序员转型AI工程师成功案例:面对AI替代危机,后端开发小李主动报名深度学习课程,半年后成功转型大厂深度学习工程师,薪资翻倍至60万+。文章推荐唐宇迪博士主讲的《人工智能深度学习涨薪就业班》,课程包含450+课时、200+实战案例,涵盖大厂最新技术要求,提供就业内推和1对1指导,帮助学员把握AI时代机遇实现职业跃升。第13期课程限时优惠,适合在职转型和应届求职人群。

2025-09-16 17:05:37 437

原创 研一,在学机器学习和深度学习,为什么感觉越学越不会,怎么解决这个问题?

当然也不用太累,做实验期间,你该上课上课,该打球打球,该看电影看电影,该约火锅约火锅,生活要丰富起来,精神才能丰富,锻炼身体不要落下。刚考上研没多久,老师叫我学习机器学习和深度学习,看了很多的教程,都是一知半解的,遇到面对大量的数学公式、算法原理、编程代码很容易感到迷茫,不知所措,越学越糊涂反而学不懂了,是不是有很多人有相同的感受呢,如果你想在最短的时间内让自己用起来,并掌握机器学习和深度学习,可以这样去学习。你得试着去适应它,刚开始可能觉得难,但等习惯了就会发现,编程其实没什么难的,上手后都是小问题。

2025-09-15 19:12:17 1097

原创 一文搞懂大模型:何为深入理解Agent?

摘要:本文系统拆解了“深入理解Agent”的能力层级,从概念理解到架构设计分为四个层次,并详解了各层级的技术要求和面试考察点。Level1要求本质认知,Level2关注技术实现,Level3强调系统优化,Level4侧重架构创新。文章还提供了面试判断标准、学习资源推荐,指出工程思维是Agent开发的核心竞争力。最后建议系统化学习路径,强调实践交流的重要性。

2025-09-13 17:48:05 895

原创 彻底搞懂深度学习-多模态学习(多模态对齐 + 多模态融合)(动图讲解)

多模态学习让AI系统能像人类一样综合处理图像、文字、声音等多源信息,其核心技术包含两个关键环节:多模态对齐和多模态融合。对齐解决不同模态信息的对应关系,如CLIP模型通过对比学习建立图像与文字的语义关联;融合则关注如何整合多模态数据,包括早期融合、晚期融合和动态交互的交叉融合三种策略。现代Transformer架构凭借统一的token化处理和自注意力机制,为多模态学习提供了理想框架,推动了GPT-4V等新一代多模态模型的突破。这一技术演进正推动AI从简单特征匹配向深度语义理解转变。

2025-09-12 15:00:57 1243

原创 又登CVPR,我悟了,Transformer+CNN+注意力机制组合才是论文收割机!

【AI混合架构研究新突破】三篇顶会论文揭示Transformer+Attention+CNN的创新应用:1)提出NeuralAttention机制,用神经网络替代点积注意力,提升模型表达能力;2)解析self-attention的几何结构,证明训练目标对矩阵特性的塑造规律;3)将线性注意力重构为动态VAR模型,在时间序列预测中实现SOTA性能。这些研究为复杂任务建模提供了新思路,涵盖NLP、CV和时间序列预测领域,显著提升模型效果与可解释性。

2025-09-11 17:07:15 505

原创 万字长文:大模型“记忆体”机制解析及研究方向

本文系统介绍了大语言模型记忆机制的研究进展与应用。首先阐述了记忆对大模型的重要性,指出记忆模块是LLM实现长期交互、个性化服务和动态知识更新的关键。文章从认知心理学、自我演进和应用需求三个维度分析了记忆机制的必要性,并详细探讨了记忆模块的设计要素,包括记忆来源(交互过程、跨交互历史、外部知识)、记忆形式(文本记忆与参数记忆)和记忆操作(写入、管理、读取)。文章还介绍了多种代表性记忆机制实例,如Reflexion、MemoryBank、MemGPT等,并特别分析了字节跳动提出的M3-Agent多模态记忆框架。

2025-09-10 14:23:07 880

原创 彻底搞懂深度学习:强化学习和智能体

《强化学习与智能体的本质区别及大语言模型智能体的崛起》摘要:强化学习是一种通过试错和反馈来优化决策的方法论,而智能体是一个能自主感知、决策和执行的系统架构。两者可独立存在也可结合,如AlphaGo就是强化学习智能体。随着大语言模型(LLM)的发展,出现了新型LLM智能体,其以语言为通用接口,可分为对话式、任务导向和多智能体协作三种模式。LLM智能体与传统智能体各有所长:前者适合自然语言交互和快速开发,后者则擅长精确控制和实时响应。在实际应用中,应根据需求选择合适的技术路径或将两者结合使用。

2025-09-09 14:50:55 981

原创 KDD 2025 | TIDFormer:针对时序交互动态机制,构建动态图 Transformer 模型

本文提出TIDFormer动态图Transformer模型,通过创新设计的交互级别自注意力机制(IL-SAM)和三个动态编码模块(MTE、BIE、STE),有效解决了动态图建模中时序和交互动态的联合表征问题。实验表明,该模型在7个真实数据集上性能优于现有SOTA方法,训练速度比同类Transformer方法快1.7-2.3倍,特别在二分图场景下表现突出。研究创新性地验证了动态图自注意力机制的可解释性,为动态图Transformer提供了明确的设计准则。

2025-09-06 17:28:25 700

原创 机器学习、深度学习以及人工智能的区别和联系!

本文简明介绍了人工智能、机器学习和深度学习的区别与联系,从概念、学习方式、数据需求、模型复杂性和应用领域五个方面进行对比分析。人工智能是让机器模拟人类智能,机器学习是其子集,通过数据学习规律,而深度学习则是机器学习的分支,采用多层神经网络处理复杂任务。

2025-09-04 16:06:40 482

原创 阅兵背后的科技:战场上的目标检测与无人机巡检

今天是国家阅兵仪式,看着一个个整齐的方阵、一辆辆先进的装备驶过,我们不仅为国家的强大而自豪,也不禁感叹现代军事科技的飞速发展。在现代战争中,准确检测战场上的士兵、坦克等目标以及高效的无人机巡检至关重要,它们是提升军队战斗力的关键因素之一。下面就让我们一起来了解一下这些先进的技术。

2025-09-03 17:07:37 1900 3

原创 LUD-YOLO:一种用于无人机的新型轻量级目标检测网络

本文提出LUD-YOLO,一种专为无人机设计的轻量级目标检测算法。该算法基于YOLOv8改进,通过创新特征融合模式解决特征交互退化问题,引入动态稀疏注意力机制提升特征提取效率,并采用网络瘦身技术实现模型轻量化。在VisDrone2019和UAVDT数据集上的实验表明,LUD-YOLO在检测精度和速度上均优于10种主流算法,特别在小目标检测方面表现突出。该研究为无人机目标检测提供了平衡模型大小与检测精度的有效解决方案,代码已开源。

2025-09-03 17:05:07 854

原创 为什么神经网络网络算法比机器学习模型算法更加强大?

神经网络(尤其是深度神经网络)相比传统机器学习模型(如线性回归、决策树、支持向量机等)的“强大”主要体现在其更强的表达能力、自适应特征学习能力以及对复杂模式的建模能力。但这种“强大”并非绝对,而是有特定条件和适用场景的。

2025-09-02 17:49:02 1853 1

原创 通透!随机森林VS回归树 !!

这篇文章对比了回归树和随机森林在回归问题中的表现差异。回归树是单一模型,通过递归分割空间进行预测,容易过拟合但解释性强;随机森林作为集成模型,通过Bagging和特征子采样提高泛化能力,更适合复杂数据。实验显示随机森林在拟合非线性数据、抗噪声方面表现更优,MSE和R²指标均优于回归树。建议:简单数据用回归树(解释性好),复杂数据选随机森林(性能强)。文章还提供了完整的Python实现代码和可视化分析。

2025-08-31 12:45:00 619

原创 知乎热议:机器学习已死

机器学习岗位竞争激烈但前景广阔,985本科+3年经验已不占优势,高区论文成为求职关键。从推荐系统到自动驾驶,机器学习应用无处不在,但新手常陷入细节迷茫。建议从经典论文入手,掌握领域发展脉络

2025-08-30 11:39:16 255

原创 超全面讲透,贝叶斯检验 !!

本文系统介绍了贝叶斯检验的原理与应用。首先阐述了贝叶斯检验的核心思想:通过先验概率和新数据更新假设的可信度(后验概率),区别于传统p值检验。详细推导了贝叶斯定理公式,说明了假设检验五步骤:定义假设空间、设定先验概率、计算似然函数和边际似然、求后验概率。通过药物效果对比案例,演示了使用PyMC3建立贝叶斯模型、MCMC采样、后验分析及贝叶斯因子计算的全流程。最后指出贝叶斯方法的优势在于能融合先验知识,并讨论了模型优化方向。文章还提供了AI学习资源,助力读者掌握统计建模与科研能力提升。

2025-08-29 18:57:33 906

原创 ICML 2025 | 时序预测新 Loss:Patch 级别结构损失

【研究摘要】天津大学团队针对时序预测中传统损失函数忽略结构依赖性的问题,提出创新的片段级别结构损失(PSLoss)。该方法通过傅里叶变换自适应分段,在局部片段上联合优化相关性、方差和均值三个结构指标,并采用梯度动态权重调整实现平衡优化。实验表明,PSLoss在Transformer等7类模型上均显著提升预测性能,尤其在保持趋势一致性和波动匹配方面表现突出。该成果为时序建模提供了新的结构感知优化视角,相关代码已开源。

2025-08-28 15:29:37 582

原创 Transformer模型深度解析!

Transformer架构自2017年提出以来,已成为AI领域的“通用计算引擎”。本文系统解析了其核心原理:1) 自注意力机制突破RNN序列建模瓶颈,实现全局依赖捕捉;2) 编码器-解码器结构通过多头注意力、位置编码和前馈网络处理序列;3) 输入层Tokenizer和Embedding将文本转化为数值表示;4) 残差连接和层归一化保障训练稳定性。该架构已从机器翻译扩展到多模态任务,展现出强大的泛化能力。文章详细阐述了各模块实现细节,包括数学表达和PyTorch代码,为理解现代AI模型提供技术基础。

2025-08-27 15:01:37 905

原创 大模型全栈学习路线:4 - 6 个月从入门到实战,打通技术与业务闭环

本文系统规划16周大模型学习路径:1-2周夯实基础(Transformer原理、开发环境搭建);3-10周技术攻坚(PyTorch实现经典算法、大模型微调与跨模态应用);11-16周实战输出(竞赛/论文突破+全栈项目开发)。路线涵盖编程基础→核心算法→CV/NLP融合→业务落地全流程,建议结合导师指导解决环境配置、参数调优等共性问题,并通过组队学习提升效率。

2025-08-26 17:43:48 1220

原创 智能体新范式Chain-of-Agents,多项任务新SOTA 原创 编辑部 深度学习自然语言处理

《Chain-of-Agents:端到端智能体基础模型的新范式》论文提出了一种创新性的多智能体内化协作框架。通过将传统多智能体系统的协作过程转化为模型内部的"思维链",该方案实现了计算效率与协作能力的双重突破。研究采用多智能体蒸馏和智能体强化学习两阶段训练,在Web和Code任务上显著超越现有方法,同时降低84.6%的令牌消耗。实验证明,该模型不仅具备零样本工具使用能力,还展现出更高的性能潜力上限,为构建高效通用的AI智能体提供了新思路。

2025-08-25 17:58:46 753

原创 万字解析!一文快速预览经典深度学习模型——CNN、RNN、LSTM、Transformer、ViT

本文系统介绍了深度学习中几种重要的神经网络模型。首先详细解析了CNN的基本结构,重点说明了卷积运算和零填充的计算方式。其次阐述了RNN的序列处理能力及其梯度问题,并介绍了其改进模型LSTM通过门控机制解决长程依赖问题。最后深入讲解了Transformer的自注意力机制和多头注意力结构,以及ViT(视觉Transformer)如何将Transformer应用于图像处理。全文通过模型结构图和各组件功能说明,系统呈现了这些深度学习模型的核心原理与应用特点。

2025-08-23 15:58:23 1046

原创 学习深度学习之前要不要先学习机器学习?到底应该先学哪个?

摘要:机器学习与深度学习的学习顺序应根据目标领域而定。处理表格等结构化数据建议从机器学习入手;若专注于图像或文本处理,则可直接学习深度学习,掌握线性回归和逻辑回归后快速转向神经网络实践。

2025-08-22 13:49:26 1045

原创 如何在自定义数据集上训练 YOLOv8 实例分割模型

本文介绍了使用Ikomia API微调YOLOv8-seg预训练模型的过程,以提高其在珊瑚数据集上的实例分割性能。文章详细讲解了YOLOv8-seg的架构特点、训练参数设置以及通过Ikomia API实现模型训练和测试的具体步骤。实验结果表明,微调后的模型能够有效识别珊瑚物种,但仍存在一些假阴性情况,建议通过增加训练周期和数据增强来进一步提升模型性能。整个过程在NVIDIA RTX3060 GPU上约需1小时完成。

2025-08-19 18:01:12 920

原创 深度学习图解:神经网络如何学习?

文章摘要:本文详细介绍了使用神经网络预测冰淇淋销售的实现过程。首先阐述了如何确定网络架构(1个隐藏层,2个神经元),并重点讲解了通过梯度下降法优化模型参数(权重和偏差)的方法。文章比较了暴力破解法、梯度下降法和随机梯度下降法的优缺点,指出梯度下降能有效寻找最优参数值,但随着数据量增大可能出现计算效率问题。最后简要提及了学习率设置的重要性及其他优化算法,为神经网络训练提供了系统性的方法指导。

2025-08-19 14:22:54 1184

原创 万字干货!小白必看!何利用pytorch搭建一个完整的深度学习项目!

本文系统介绍了使用PyTorch构建深度学习项目的完整流程,包括数据集加载、数据预处理、模型构造、训练与测试等关键环节。

2025-08-18 11:48:00 798

原创 哈工大博士历经两年制作的PyTorch笔记!让你一篇笔记搞懂PyTorch!

PyTorch凭借其易用性和灵活性成为热门深度学习框架,深受学生和研究者青睐。为帮助学习者快速掌握PyTorch,耗时数月整理出最全的PyTorch函数手册,包含200+常用函数,从基础张量操作到高级应用全面覆盖。该手册共14章,是深度学习研究和论文写作的实用工具。

2025-08-14 18:06:50 209

原创 AI深度学习入门指南—数学基础精讲(概率论)

概率与统计是深度学习的理论基础,用于处理数据不确定性和优化模型性能。概率论通过离散型(如二项分布、泊松分布)和连续型(如正态分布、指数分布)概率分布描述数据规律;统计学则通过均值、方差等指标分析数据趋势和离散程度,并利用假设检验和相关性分析验证模型可靠性。图形化工具(直方图、箱线图等)帮助直观理解数据分布。特别地,正态分布因其普遍性(如68-95-99.7法则)和中心极限定理的重要性,成为关键工具。Z值标准化可统一数据量纲,便于比较。这些方法共同支撑数据建模、预测及决策过程。

2025-08-13 15:47:50 840

原创 机器学习入门学习教程(附中文版学习笔记)

吴恩达机器学习课程是入门经典,但英文课件可能增加学习难度。配套的机器学习笔记提供中文对照,涵盖10周核心内容:从基础概念、线性回归(1-2周)到神经网络、反向传播(4-5周),再到SVM、聚类降维(7-8周)及推荐系统等应用(9-10周)。重点标注了难度等级(1-3星),建议2个月系统学习,笔记与视频配合使用效果更佳。特别强调梯度下降、逻辑回归、模型评估等关键知识点,适合快速掌握机器学习核心内容。

2025-08-12 17:25:07 480

原创 刚入门深度学习?先别急着学框架!0 基础必看的学习顺序(从 Python 到数学再到实战)

本文介绍了机器学习与深度学习的关系,指出深度学习是机器学习的子集,特别适合处理图像、语音等复杂数据。文章建议初学者先打好机器学习基础,掌握Python、Numpy、Pandas等工具,再学习PyTorch框架和深度学习核心概念。推荐通过小项目实践巩固知识,强调坚持学习的重要性。

2025-08-09 15:15:00 560

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除