- 博客(740)
- 收藏
- 关注
原创 无监督强化学习新突破!无需标注,性能飙升159%!
最近,强化学习的一项突破帮助我们向AGI又迈进了一大步!那就是清华&上海AI Lab的Test-Time RL(测试时强化学习),无需标注,模型自学,性能飙升159%!Test-Time RL是一种无监督强化学习方法,相较于传统强化学习,这类方法可以解决依赖人工奖励、数据效率低、探索能力弱等问题,有很强的自主性、高效性和适应性,特别适合在奖励稀疏、环境未知或任务复杂的情况下应用,发展前景广阔。
2025-05-27 17:22:28
212
原创 接Accept!“机器学习+SHAP”发文大有可为,轻松拿下一区SCI!
在需要高可解释性且数据复杂的场景,比如医疗、法律、工业等,机器学习+SHAP是个潜力巨大的研究方向,目前也已经成为了学术热点。这是因为这种结合拥有提供模型可解释性、公平性检测、模型调试和优化、业务场景适配等能力,在增强机器学习模型的透明度和可信度方面遥遥领先,解决了我们对可解释性的迫切需求。这种研究热情也体现在近期的成果上,多个中科院TOP期刊都发表了相关论文,推荐感兴趣的同学关注。这边为了帮各位节省查询的时间,我已经整理好了11篇机器学习+SHAP新论文,需要的自取~
2025-05-26 18:20:03
153
原创 用CNN做时间序列预测,拿下多篇中科院一区TOP!
在处理复杂、高维和非线性的时间序列数据上,会比传统方法更适合,可以给我们提供更强的建模能力、更高的计算效率和更好的扩展性。这些优势同时也带来了巨大的发展空间,目前该方向已经成功应用于金融、能源、医疗、环境监测等多个领域,多项突破性成果登上中科院一区TOP,已然成为当前的热门研究方向。为了方便感兴趣的同学找参考,加快论文进度,我从近期中挑选了,都是值得深入研读的paper,需要的同学可无偿获取。全部论文+开源代码需要的同学看文末。
2025-05-23 17:50:21
629
原创 贝叶斯优化+CNN+LSTM=小论文创新点
2周速成小论文可能吗?有点悬,但有可能。这种“三结合”的优势在于技术成熟度高(经典CNN和LSTM)、创新点灵活性强:如果不改模型结构,可以做新场景应用、超参数优化对比、轻量级创新...再加上实验可模块化,目前已成为机器学习领域热门投稿方向!感兴趣的同学速速关注。另外我也多提一嘴,对于论文er来说,小论文要的不是0到1,而是0.5到0.8,有合适的参考才能更快找到idea!为了帮各位省掉找参考的步骤,加速论文进度,我已备好,无偿分享~全部论文+开源代码需要的同学看文末。
2025-05-20 19:04:17
820
原创 只做注意力机制怕是不够了,想要高分得加快速傅里叶变换!
快速傅里叶变换FFT,信号处理的经典算法,通过结合学术热点注意力机制,可以有效解决传统CNN在长程依赖建模、计算效率优化等核心问题上的局限性,应用扩展性高,尤其适合多模态融合等复杂任务。这方向目前已在ICLR等顶会中频繁出现,微软等也提出过SpectFormer,在各CV任务中取得了SOTA性能!可见对论文er来说,无疑是个创新性高,顶会接受度好,适合发论文的研究方向,推荐有论文需求的同学关注。
2025-05-20 10:07:15
866
原创 LSTM+时间序列异常检测,发文香饽饽!
是目前比较活跃的研究方向,它解决了传统方法在长依赖建模、非线性适配、自动化特征提取等方面的不足,有效提升时序异常检测的性能,是工业物联网、金融风控等领域重要的、值得深入学习的技术。这方向也是,成果产出不少。如果单纯想发论文,可突出一下应用创新和工程优化。如果是有高区需求,还是建议往理论创新(比如新型架构)或跨领域应用方面深入探索,同时也需关注前沿技术,方便引用(比如VAE-LSTM)。我这边已经帮大家整理好了,开源代码已附,如果实在没思路,或者复现遇到困难,欢迎来交流。
2025-05-16 18:49:24
527
原创 2025年,多模态特征融合只会更火
从近期各大顶会的论文占比上就可以看出,这方向仍然是今年的发文热点,尤其在医学、自动驾驶等垂直领域。现在顶会对解决实际问题的创新方法接受度较高,而多模态特征融合能够,又得益于其通用性,在教育、娱乐、人机交互等多样化场景中都十分适用。因此这方向无论是创新性,还是发展前景都非常可观,论文er可冲。同时也建议各位结合Mamba等新兴模型与具体应用场景做创新。我这边整理了,可用作参考,需要的同学自取。全部论文+开源代码需要的同学看文末。
2025-05-15 19:53:46
913
原创 PINN与KAN终于结合起来了!发SCI一区Top超简单的!
当前仍处于早期阶段,关于它的研究还在不断探索中。最近发现它有不少值得关注的成果,比如ESWA的自监督网格生成方法MeshKINN、CMAME的神经网络框架KAN-ODEs。这方向的优势在于既能够遵循物理规律,又能够结合领域知识,给我们提供更透明、更可靠的解释,在需要高可解释性的复杂任务中非常适用,因此是工业界的香饽饽,很适合相关领域有论文需求的同学研究。至于创新点,未来可能会往等方面突破,不过这方向代码实现的复杂度较高,建议大家结合具体应用场景做创新。如果需要参考,可直接拿我整理的,开源代码已附。
2025-05-14 17:58:18
695
原创 强化学习的大杀器!登上《Nature》正刊!
9年前AlphaGo杀穿围棋界,如今的Deepseek-R1引爆AI圈,强化学习的长久影响力有目共睹。作为当今AI领域最热门的词汇之一,2025年强化学习依然会是重点研究方向。在最近的RL研究成果中,《Nature》正刊上的Dreamer算法值得关注,它涉及到了未来不可忽视的方向:“通用强化学习”。如果是想要发RL相关论文的同学,强烈推荐研读。另外还有一些RL研究方向,比如当下正热门的RLHF、样本效率提升、多智能体强化学习等,创新多容易出成果。
2025-05-13 18:39:47
1133
原创 2025年,大模型LLM还有哪些可研究的方向?
近两年LLM在学术界与工业界的发展大家都有目共睹。到了今年,以预训练LLM为代表的大模型PK上半场已然结束,接下来就要进入下半场大模型2.0时代了。那么在这新赛道,关于大模型我们还有什么可做的创新?要知道,如今的大模型研究已经从单纯的"规模竞赛"转向"效能突破"与"应用重构",研究者们致力于构建可持续进化的智能生态系统。因此,多模态大模型、智能体agent等这类围绕大模型技术演进核心矛盾的方向尤其值得关注。
2025-05-13 14:02:15
545
原创 顶刊风向标!Attention+LSTM+特征融合制霸中科院一区!
Attention+LSTM+特征融合,时间序列预测的主流方法之一。这种结合的优势在于动态特征筛选与多源数据整合能力,特别适合处理复杂时序关系,在工业预测、金融股价预测等应用场景如鱼得水。这方向目前也是中科院一区常客,比如ESWA上的CIR-DFENet框架、Energy and AI上的DGL-STFA、EAAI上的GD-CAF 模型...我从中挑选了14篇Attention+LSTM+特征融合新论文,整理好了原文PDF和代码,方便需要参考的同学找idea。如果实在没思路,可以考虑往跨领域迁移、多模态融合
2025-05-08 17:39:37
1012
原创 “SAM+多模态图像融合”这个idea一出,就有人用它发了CCF-A!
SAM自推出以来,已经广泛应用于CV各任务,各种创新层出不穷。到了2025年,SAM仍然有相当大的优化空间,尤其是通过结合多模态图像融合,可以进一步提高分割精度和效率,增强适应性,大幅拓宽应用场景。对论文er来说,这也意味着创新空间更大了。目前在CVPR、IJCAI等顶会上已经出现了不少相关成果,比如性能超越SOTA的SAGE方法、鲁棒多模态3D目标检测框架RoboFusion。感兴趣的论文er抓紧时机!
2025-05-07 17:52:25
779
原创 CNN+Transformer+Mamba,多热点联合=不撞车+高分保证√
CNN的局部感知,加上Transformer的全局视野,再加上Mamba的高效建模,能产生怎样的火花?厦大图像修复模型RestorMixer给出了答案,它在多个图像恢复任务中都实现了SOTA性能。事实上,这类结合Mamba、CNN和Transformer的混合架构是当下深度学习领域的热门研究方向,不仅适合发论文,也能推动模型在效率与性能上的双重突破,在工业界应用前景相当广阔(比如腾讯混元T1)。
2025-05-06 18:10:28
700
原创 2025时间序列都有哪些创新点可做——总结篇
作为AI和数据科学的核心方向之一,在2025年依然保持着强劲的发展势头,稳站各大顶会顶刊投稿主题前列。关于它的研究,目前在结合传统统计方法和深度学习的基础上,已延伸至频域等数理工具与神经网络的交叉创新。同时针对垂直领域痛点的算法优化也成为重点突破方向。本文汇总了2025年时间序列一些可做的创新点,来自,分为算法融合、模型架构、算法优化、训练技巧、数据增强5个大方向,涵盖上述频域+时序、小波变换+时序等热门组合。全部论文+开源代码需要的同学看文末。
2025-04-25 18:00:35
743
1
原创 SAM进化版开源!100倍推理加速!这思路简直杀疯了...
尽管SAM在处理大规模序列比对数据上难以替代,但它在速度、准确性、灵活性及功能扩展方面仍然有所欠缺。为了解决这些问题,研究者们,比如近期清华&英伟达推出的SAMEO框架,以及实现100倍的加速推理的TinySAM。另外还有很多成果已被顶会顶刊收录,简单看了点就有ICLR 2025上的MTSAM、SAMRefiner两篇,Nature Methods(中科院1区)的μSAM工具...可见现在有关SAM的研究有多热门。为了方便论文er快速了解前沿,这次我从中挑选了。
2025-04-23 17:44:35
548
原创 Mamba还能这么玩?新SOTA横扫14个图像修复任务,计算量降低150倍!
核心优势在于Mamba的长序列建模能力,可以替代Transformer,在高分辨率或复杂场景的实时修复等任务中优势显著。这意味着,Mamba+图像修复会在热门的医学图像、自动驾驶等领域发展迅猛,落地前景可观。再加上,近年主流顶会(比如CVPR)对SSM类模型接受度较高,比如横扫14个图像修复任务的MaIR、降低150倍计算复杂度的Serpent...非常适合有论文需求的同学研究。本文整理了,大多都开源了,想快速出成果的同学可以直接拿来做参考,同时也建议从等角度做创新,比较容易上手。
2025-04-22 17:55:46
813
原创 高分利器:Transformer+图像处理!创新性绝了,3位 IEEE Fellow推荐的含金量!
Transformer还能怎么做创新?西工大&台湾清华等3位 IEEE Fellow给出了思路:一种异构窗口 Transformer的图像处理方法,在去噪时间上仅占流行Restormer的30%。其实,近两年一直很活跃,因为Transformer核心的自注意力机制比CNN更能灵活处理目标检测、分割等CV任务,尤其是高效结构设计、跨模态应用和领域适配等。因此这个方向的研究多,顶会顶刊成果也不少,比如IEEE TIP的SENet、CVPR 2025的PFT模型...都值得研读。
2025-04-21 18:42:38
306
原创 顶刊神思路!融合Transformer与CNN做医学图像!!
众所周知的热门组合。搜前沿的时候发现它在领域高质量成果不少。比如登上1区TOP刊的混合DL架构TBConvL-Net、CFFormer混合模型、医学图像分析模型Sdr-former...原因在于这类混合架构可以更准确地识别和定位病变区域,提高诊断准确性,同时减少对标注数据的依赖,非常契合当下医学界的需求(比如计算资源有限的问题),研究前景广阔。如果需要发论文,这方向是目前比较好的选择,搞创新的话可考虑等角度,建议论文er从临床痛点反推模型设计,不要单纯堆叠模块。本文整理了。
2025-04-18 17:50:31
463
原创 LeCun谢赛宁新作爆火!多模态自监督学习成一区TOP/CCF-A香饽饽!
是真挺热的,简单看了几篇研究,不是一区TOP就是CCF-A。比如AAAI 2025的Mentor系统、顶刊IEEE IOTJ的SketchTriplet方法(下文都会细说)...另外还有LeCun谢赛宁的新作,验证了SSL在多模态任务中超越CLIP的潜力。非常建议对多模态自监督学习感兴趣,且有论文需求的同学研读。我这边也打包好了,无偿分享!掌握这些idea顶会顶刊中稿率up!...没思路的同学可以深入挖掘一下。全部论文+开源代码需要的同学看文末。
2025-04-18 12:20:56
377
原创 YOLO永不过时!全新轻量级版本拿下中科院1区TOP!创新性MAX
近期看见很多,其中拿YOLOv8n、YOLOv5改的比较多,当然还有最新版的,发一区到三区的基本都有,可创新空间很大,看来YOLO依然是我们“水论文”的好选择。分享几个高区成果:Neurocomputing(二区)上的YOLO-ELWNet,基于YOLOv3改进,猛猛超越其他轻量级OD模型;还有Comput Electron Agric(一区)上的CO-YOLO,基于YOLO11n架构,实现大幅提高姿态识别效果。另外还有一些新研究,非常推荐想用YOLO发论文的同学研读,无偿分享。
2025-04-17 10:17:21
731
原创 一天连发两篇Nature正刊!谷歌医疗LLM杀疯了!
谷歌也是厉害,不久前1天之内连发2篇Nature,都是关于的,模型都叫AMIE,分别对诊断对话和诊断推理做了优化,并做了随机双盲实验,验证了AMIE出色的辅助诊断能力。当然,作为AI领域最被看好,且一直不缺讨论度的方向,我们国内也不缺医疗LLM优秀成果:杭州“智诊科技”的WiseDiag,实现三甲专家人人可用,是全球领先的医疗AI大模型!这些成果证明了医疗LLM市场的火爆,在科技界大佬们的推动下,研究前景只会愈发广阔。这里也推荐一些需要参考的可直接领取我整理的,基本都有代码,方便复现找灵感。
2025-04-15 17:55:58
454
原创 入选CVPR 2025!清华&华科大提出超强异常检测新方法!学会你也能发顶会
有新突破了!清华和华科大推出了INP-Former,从单张图像中提取正常模式,展现出卓越的性能和强大的泛化能力!成功被CVPR 2025收录。仔细一瞧,今年的CVPR上异常检测相关的研究还挺多,比如最新零样本工业缺陷异常检测SOTA:AA-CLIP,还有突破跨领域限制的UniVAD,通过统一模型实现无需训练的泛化异常检测!这些成果也足以证明,而且根据其在AIGC等新兴技术领域的拓展,未来在方面应该会更有搞头。同时,我们也可以关注可解释、低资源等核心挑战,再结合垂直场景的深层次需求做创新。本文整理了。
2025-04-14 17:49:29
676
原创 2025年值得关注的15个RAG开源工作
想必各位都碰到过大模型瞎回答的情况,也就是大模型“幻觉”。而,就是解决这个问题的核心技术之一,在提升大模型回答的准确性和可靠性上,它拥有不可替代的作用。鉴于大模型发展的必然趋势,以及对效率、可信性、实时性持续增长的需求,关于RAG的研究也必然是焦点。再加上,未来文本、图像等多模态扩展和垂直领域应用将成为主流,RAG的发展机会只多不少。今年,我们对RAG的创新主要围绕等方向。建议论文er注意结合新兴技术与实际需求,多关注技术落地中的瓶颈问题。为方便找idea,我这边还整理了,需要参考的直接取。
2025-04-11 17:57:34
785
原创 凭借SAM+多模态又发一篇CVPR!字节&北大都在做,跟上别掉队了!
前阵子,迎来了新突破,字节、北大联合提出了市面上第一个结合SAM2和LLaVA的多模态大模型,在视频编辑和内容创作等任务中实现了SOTA性能。实际上,这方向的,去年CVPR/ICML/NeurIPS等顶会中相关论文占比近1/3,今年的CVPR 2025上,SAM+多模态更是火热(比如实现了视觉与任务统一的SAGE方法),无疑是发论文的好选择。如果感兴趣,建议同学们抓紧上手,SAM+多模态现在。
2025-04-10 17:41:14
485
原创 冲上中科院1区TOP!“频域+PINN”发高分SCI易如反掌!
新成果发表在Applied Energy(中科院1区TOP)上,一个基于频域物理信息的神经网络FD-PINN,在三维时空风场预测任务中性能出众。这种结合通过将频域物理约束融入PINN的损失函数,提升模型对频变特性的捕捉能力,在许多应用场景,尤其是波动主导的物理场景中拥有不可替代的作用,如果准备入手,今年比较推荐高频Helmholtz方程求解,声学超材料逆向设计,电磁散射快速仿真等课题,同时也建议论文er从具体应用痛点切入,设计问题导向的频域优化策略。需要参考可看我整理的,有代码。
2025-04-09 17:03:04
483
原创 入选ICLR‘25 Spotlight!深度强化学习(DRL)迎来新突破!
近年来,相关的成果在顶会顶刊上接受度普遍较高,经常上榜ICLR、Nature、Science等。比如ICLR 2025上的一篇Spotlight,由清华团队提出,介绍了一种SmODE网路,让深度强化学习的控制更加丝滑!另外还有复旦、同济等联合提出的全新社区布局生成方法,也是基于深度强化学习...从这些成果来看,目前关于深度强化学习的研究多围绕合,尤其是结合注意力机制、GNN等,因为可以明显提升算法性能,已经成了顶会的大热选题。如果想深入挖掘,除了以上这些角度,也可以考虑。
2025-04-08 17:05:00
1075
原创 2025年还在用KAN网络的也是神人了...
自从KAN的原始论文发表,相关研究就层出不穷,比如前段时间港中文提出的很有代表性的U-KAN,在准确性以及计算成本方面遥遥领先。还有刚公布录用的ICASSP 2025,其中关于KAN的创新成果更是不少。Nature子刊以及IEEE上也有优秀成果陆续发表,比如CKANs模型、PIKANs架构...可见从这些成果来看,目前关于KAN的创新大多都从等角度切入,大家找idea也建议从这些开始,需要参考可直接看我整理好的,基本都有开源代码。
2025-04-07 17:34:38
1279
原创 频频登顶Nature子刊,UNet实在太好用!
UNet自被提出以来,已经被引用超过5万次,至今仍然是各大顶会顶刊的常用baseline,关于它的改进自然也是相当火热,近些年更是频频登上Nature子刊。简单看了一些成果,可以说是五花八门,主要围绕等几个方向展开。不过除了医疗这个核心场景,UNet在工业与新兴领域也有了不少拓展,对于论文er来说,等于又有了新的创新空间,建议感兴趣的同学抓紧搞起。如果需要参考,我这边也整理了,包含了上述的几个细分方向,基本都有代码,无偿分享~全部论文+开源代码需要的同学看文末。
2025-04-03 16:20:34
832
原创 Mamba杀入遥感图像!11个全开源idea,助你无痛发顶刊!
一方面,Mamba相关的研究不算太卷;另一方面,Mamba强大的全局建模能力和高效的计算效率,完美切合遥感图像领域计算效率、长距离建模、多时相分析等方面的需求。因此,在众多对实时性要求高的场景(比如城市规划、国防安全等)中,Mamba+遥感图像的优势巨大,它的落地前景自然广阔。相对的,关于它的研究成果也逐渐增多,不少高质量新成果陆续发表,比如顶刊TGRS上的ChangeMamba。如果大家感兴趣,趁这方向还处于低饱和状态,抓紧上车。创新建议紧扣遥感数据特性(比如多模态、多尺度),重点在上突破。
2025-04-02 17:16:20
768
原创 (CVPR 2025)卷积网络复活!港大最新改进版CNN涨点起飞!
有人说现在研究CNN已经没啥意义了?不如先看看今年CVPR'25上超多的CNN成果。这其中,港大最近重磅推出了新型纯CNN架构OverLoCK,性能连超传统CNN、Transformer与Mamba!实力证明而且,CNN在图像、视频等领域仍然是主流,我们在轻量化和结构创新上的改进也在持续推进CNN的效率与性能,现在的CNN在一些新兴的应用场景(比如元宇宙)中也有了进一步拓展,因此,对CNN感兴趣或有需求的同学不要犹豫,抓紧时间搞创新。目前围绕CNN的创新主要有(比如LSTM),其中结合小波变换相当火。
2025-04-01 17:31:11
2231
原创 Transformer+UNet到底是谁想出来的点子!用来创新真的太绝了!
其实不仅仅是这领域,这种技术在需要处理大尺度图像、长程依赖、多模态数据的任务中都很关键,源于其结合了UNet的多尺度特征提取能力和Transformer的全局建模能力,因此应用场景相当广泛。对应的,近年关于Transformer+UNet的研究越来越火热,论文数量持续增长(如CSWin-UNet、GS-TransUNet、TSUBF-Net等),可参考的优秀成果相当多。不过目前这方向在计算效率、多模态融合、轻量化设计、特定场景下的优化等方面依然还有改进空间,值得我们深入挖掘。
2025-03-31 17:28:53
1021
原创 “具身智能”顶会大爆发!李飞飞新作获最佳论文,这思路我吹爆!
今年是越来越火了,李飞飞团队的成果一个接一个,上回还是荣获CoRL-LEAP研讨会最佳论文奖的ReKep,这个月月初又发布了𝗕𝗥𝗦,一个解决机器人在家庭任务中全身操作问题的综合框架,500美元就能让机器人帮你干一切家务!另外还有许多成果成功登上各大顶会,足见具身智能!加上之前看过的麦肯锡预测,到了2030年,全球具身智能市场规模可能达到数十万亿元,!入局不亏。那么问题来了,未来我们该向何处发力?鉴于具身智能泛化性等核心问题尚未解决,建议考虑跨学科融合、底层技术革新等方向。我还整理了,又打包了。
2025-03-28 11:11:35
494
原创 Mamba杀入图像增强!26%算力碾压SOTA!字节、华为都在做...
当前视觉领域对高效长序列建模需求激增,对这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。因此短时间内,就有不少Mamba+图像增强的成果陆续发表,比较突出的有字节等团队提出的图像恢复网络VmambaIR,仅使用26%的计算成本就实现了超越SOTA的重建精度,还有华为诺亚方舟实验室等提出的基于Mamba的图像增强方法TAMambaIR,计算效率起飞。其他还有不少值得参考的,我挑选了分享给大家,基本都有代码,搞科研还是离不开巨人的肩膀的。
2025-03-26 17:22:00
1100
原创 左手CVPR,右手顶刊!医学图像异常检测“登峰造极”进行时,冲就对了!
当下医学影像数据激增,我们对AI辅助检测的需求更加迫切(意味着工业价值高),再加上现在的技术仍然存在缺陷(意味着迭代空间大):数据标注成本高、异构性大等。可见无论是在学术界还是工业界,医学图像异常检测都备受关注。目前,这方向还是围绕等角度深入,另外还出现一些新兴的创新角度,比如4D时空建模、非监督域适应等,大家有兴趣可以研究研究。值得一提的是,这方向比较注重"临床价值-技术创新-落地可行性"平衡,建议从具体临床场景切入。如果需要参考,可直接看我整理的,包括顶会顶刊,基本都有代码。
2025-03-25 17:21:05
396
原创 审稿人最爱的技术融合!YOLO+SAM双剑合璧!速度与精度All in
众所周知,一些领域对速度与精度的要求都很高,比如自动驾驶、机器人交互、医疗影像...为了满足这些需求,推动场景的落地应用,针对的研究逐渐火热,成为了当前CV领域的热门研究方向。原理在于,YOLO以实时性为核心优势,但分割精度不足;SAM通用分割能力强,但推理速度慢。这两者结合,既能提供快速目标检测框,又可以基于检测结果精细化分割,完美实现!为动态场景下的高效精细感知提供了新思路。
2025-03-21 17:20:54
818
原创 顶会新宠!剑桥凭“机器学习+因果推断”杀疯ICLR!2025发论文的黄金赛道来了!
看了这几年各大顶会的投稿趋势,发现相关的论文增长迅猛,研究热情高涨。比如ICLR 2025上剑桥大学提出的Celcomen模型,首次实现空间转录组学因果推断可识别性。不仅如此,机器学习+因果推断在工业界的需求同样旺盛,微软、Uber等企业纷纷入场,医疗、金融、自动驾驶等领域还存在大量未解决的因果建模问题,这些可都是丰富的应用场景和创新切入点。2025年,我们可以从。
2025-03-20 16:59:50
751
原创 多模态对比学习太香了!双斩CVPR/NeurIPS!新成果及开源代码已扒
它最近在各大顶会上(尤其是CVPR)可是相当受欢迎,比如NeurIPS上的CILPLoss模块,性能达到新SOTA;还有CVPR上的BadCLIP方法、HACL方法...多模态对比学习的优势在于它,尤其在多模态表征学习、跨模态对齐、预训练模型等领域表现相当好,研究潜力巨大。这方向的创新路径也很广泛,包括动态融合、处理缺失模态、引入因果推理等。不过根据当下的研究进展,建议大家还是从等多角度切入做创新。如果需要参考,可直接领取我整理的全部论文+开源代码需要的同学看文末。
2025-03-19 17:42:37
1151
原创 入选CVPR 2025!何恺明联手LeCun改进Transformer!新思路学到就赚到~
何恺明大佬这几天又整了个大的,和LeCun联手提出了一种没有归一化层的Transformer,性能比传统Transformer更强!而且他们甚至只用了9行代码...大家感兴趣可以复现了试试。这波属实是Transformer的大突破!目前也已拿下CVPR 2025。加上前不久清华微软的爆火成果Diff Transformer,近期关于又迎来了新热潮!大家没idea的快冲!改进Transformer方法思路很多的,关键在于结合具体问题提出创新。比如针对计算复杂度问题,研究线性注意力或混合架构;
2025-03-18 17:49:07
697
原创 荣登Nature招牌1区Top!可解释的多模态融合模型迎来新突破!
现有关于多模态融合的研究多集中在模型性能的提升上,对可解释的探索比较少。但实际上,可解释性是提升用户信任、优化模型决策的关键,具有重要的研究价值,符合当前学术界对透明AI的迫切需求。因此,想要在多模态领域拥有成果,是个很好的选择。中山六院团队的可解释多模态融合模型Brim,以及Nature子刊上的可解释纵向多模态融合模型,都是近期非常值得参考的研究,推荐感兴趣的论文er研读。我另外还准备了,方便找idea的同学做参考。实在没思路的话,推荐考虑细分领域(如医疗)的实际需求,从(如动态注意力)、
2025-03-17 18:07:40
734
原创 连看几十篇YOLO论文,发现了YOLO中稿的“潜规则”!这妥妥发SCI的捷径!
看了前几天刚发表的YOLOv12,深感YOLO研究之热,这迭代速度也太快了...不过往好处想,也说明YOLO相关的研究需求非常旺盛,属于SCI常客,再加上YOLO在自动驾驶、机器人导航等领域的广泛应用,用它发论文还是比较容易的。关于,现在比较流行的有(如引入Mamba)、(如CIoU)、(如YOLOv10的NMS-Free设计)。针对现有的工业需求和未来发展趋势,我们也可以从等实际问题角度进行探索。如果大家想发论文,建议先从上述主流(如新模块设计)入手,参考多资源也多,入门轻松。我这边整理了。
2025-03-14 17:56:47
953
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人