- 博客(228)
- 收藏
- 关注
原创 ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-2)
本文集涵盖了多篇人工智能领域的前沿研究论文,主要聚焦于以下几个方向:1)异质图中基于解耦图能量的节点分布外检测模型(DeGEM),提出针对异质图的新型OOD检测方法;2)基于随机网络蒸馏的主动模仿学习;3)针对行人检测的物理世界对抗攻击(UV-Attack);4)长上下文语言建模中困惑度指标的评估;5)多粒度视频编辑技术(VideoGrain);6)视觉语言模型(CogCoM)和大型视觉语言模型的幻觉缓解方法。这些研究通过创新性的模型架构、训练方法和评估基准,解决了当前AI领域的关键挑战。每篇论文均可通过s
2025-11-30 10:29:25
1160
原创 ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-1)
本文摘要整理了ICLR2025会议中的多篇前沿论文,涵盖图神经网络、多模态大模型、扩散模型等多个领域。重点包括:SpaceGNN用于有限标签的节点异常检测、RetroInText框架增强逆合成规划、共享自动编码器识别神经活动子空间、基于大模型的生成推荐高效推理方法、提升CLIP可视化解释的对抗微调技术、扩散模型在稀有概念上的组合生成能力等。每篇论文均提供可视化解读链接,展示创新算法、思维导图和详细分析,为AI研究提供全面的前沿技术参考。
2025-11-29 08:00:34
1321
原创 ICLR-2025 视觉-语言-动作(Vision-Language-Action, VLA)论文集+全文可视化解读
摘要合集 TraceVLA论文摘要 提出视觉轨迹提示技术TraceVLA,通过叠加状态-动作轨迹增强VLA模型的时空感知能力。在15万机器人轨迹数据集上微调OpenVLA后,TraceVLA在仿真和真实任务中分别提升10%和3.5倍性能,并开发了高效4B参数紧凑模型TraceVLA-Phi3。 HAMSTER论文摘要 提出分层VLA模型HAMSTER,通过高层VLM生成2D路径指导低级策略执行精确操作。利用廉价非领域数据(如视频/模拟)训练,在真实机器人任务中实现50%相对性能提升,显著跨越领域差异。 LA
2025-11-22 19:13:04
1073
原创 CVPR-2025 视觉-语言-动作(Vision-Language-Action, VLA)论文集+全文可视化解读
视觉-语言-动作模型(VLA)是融合视觉感知、语言理解和动作决策的多模态AI框架,实现从环境感知到行为输出的闭环决策。最新研究包括:CoT-VLA引入视觉思维链推理提升模型解释能力;MoManipVLA探索模型在移动操作中的迁移应用;SOLAMI构建社交VLA框架实现与3D角色的沉浸式交互;ShowUI开发面向GUI的视觉代理系统。这些研究通过创新架构和数据集推动VLA在机器人、人机交互等领域的应用发展。(149字)
2025-11-22 19:01:07
582
原创 CVPR-2025 三维高斯溅射(3DGS, 3D Gaussian Splatting)论文合集
本文摘要介绍了一系列基于3D高斯喷溅技术的研究成果,涵盖了多种创新应用和优化方法。DiET-GS结合扩散先验和事件流实现运动去模糊;SplatAD将激光雷达与相机数据融合用于自动驾驶;FruitNinja专注于3D物体内部纹理生成;IRGS通过光线追踪处理互反射效应。其他研究包括:FlexGS实现一次训练多场景部署、Luminance-GS适应复杂光照条件、GaussianSpa优化稀疏化框架提升质量、DropGaussian处理稀疏视图问题、HoGS统一远近物体重建、EditSplat实现3D场景编辑、D
2025-11-22 18:55:34
325
原创 人体三维重建学习笔记(SMPL / SMPL‑X / SMPLify‑X)
摘要: SMPL系列模型(SMPL/SMPL-X/SMPLify-X)是当前人体三维重建的核心方法。SMPL通过形状参数β(10维)和姿态参数θ(72维)生成可动画人体网格;SMPL-X扩展为统一的身体-手-脸模型(55关节+10,475顶点);SMPLify-X则从单图2D关键点优化求解模型参数。核心流程包括:(1)基于线性blend-shape与LBS的网格形变;(2)多阶段能量函数优化(投影误差、碰撞检测、VAE先验等);(3)PyTorch实现的高效可微分计算。这些方法在虚拟人、动作捕捉等领域有广泛
2025-11-15 23:08:57
987
原创 CVPR-2025 三维人体相关论文合集
CVPR 2025三维人体研究合集聚焦多项创新成果:1)Vision-Guided Action提出注视信息增强的动作预测方法;2)HiPART采用层次化自回归Transformer解决遮挡姿态估计问题;3)IDOL实现单图像即时3D人像生成;4)MV-SSM开发多视图状态空间建模。此外还包括:运动语言统一框架(Chen)、交互式3D人体聊天工具(Lin)、单图像逼真重建技术(PSHuman)、大规模人-物交互生成系统(InterAct)以及基于简笔画的动作生成方法(StickMotion)。这些研究推动三
2025-10-26 12:19:02
940
原创 CVPR-2025 三维点云相关论文合集
CVPR 2025收录了多篇三维点云处理领域的重要论文。这些研究包括:基于Delaunay图的最小二乘法实现点云法线方向一致性、解释点云自监督预训练的统一交互方法、跨模态高斯喷溅的统一预训练模型UniPre3D、通过预测点偏移改进异常检测的PO3AD方法、多粒度上下文自适应采样技术MICAS、结合视觉语言模型的少样本点云分割,以及用于无监督语义分割的超点局部-全局分组方法LogoSP。这些创新为点云处理提供了新思路和技术突破。
2025-10-26 12:14:45
1314
原创 CVPR-2025 虚拟试穿相关论文合集
CVPR 2025虚拟试穿论文集收录了8篇前沿论文,涵盖多项创新技术:1) Choi等人提出可控多服装人像生成;2) Li团队通过合成对和噪声调度优化试穿效果;3) He开发了360度全方位高保真试穿系统VTON 360;4) Hong推出图像-时间步自适应掩码扩散Transformer框架;5) Pang实现单图4D人体生成动画;6) Miao基于扩散模型开发饰品试穿系统;7) Nam提出单图3D衣物人体分解重建;8) Wang构建多视角兆像素人体生成网格注意力模型。这些研究共同推动了虚拟试穿技术的精度和
2025-10-26 12:11:00
1028
原创 TNNLS-2025 综述文章(29篇)速览
TNNLS-2025年收录的29篇综述文章涵盖了深度学习多个前沿领域。主要研究方向包括:设备端深度学习能效优化(10.1109/TNNLS.2024.3430028)、目标检测对抗攻击(10.1109/TNNLS.2025.3561225)、神经网络知识编辑(10.1109/TNNLS.2024.3498935)、联邦学习安全(10.1109/TNNLS.2025.3563537)以及扩散模型应用(10.1109/TNNLS.2024.3476671)等。这些综述系统梳理了长尾学习、机器再学习、深度聚类等新
2025-10-25 10:47:49
958
原创 TPAMI-2025 综述文章速览
近期TPAMI期刊发表多篇人工智能领域综述文章,涵盖小样本学习、扩散模型、基础模型等多个前沿方向。其中《开放世界中的小样本学习》探讨模型在开放环境下的适应能力;3篇扩散模型相关综述分别聚焦低级视觉应用、高效实现方法和图像编辑技术;《基础模型定义视觉新纪元》分析大规模预训练模型的影响。其他研究涉及多模态学习、点云处理、图像去雨等方向,并包含多个领域基准测试,为AI技术发展提供系统性总结和未来展望。
2025-10-25 10:40:01
1184
原创 【火】CVPR-2025 扩散模型论文合集及详细解读
CVPR 2025扩散模型研究合集展示了该领域的最新进展。主要创新包括:视频编辑技术Align-A-Video和FADE;医学图像处理应用如肿瘤分割;4D肖像生成CAP4D;自动驾驶DiffusionDrive;隐私保护方法CDI和版权保护技术;以及量化优化如4位FP量化。研究还探索了扩散模型自监督学习特性,并提出了多项应用创新,如无需训练的VidSeg视频分割和个性化微调方法。这些工作展现了扩散模型在计算机视觉领域的广泛适用性。
2025-10-13 22:09:14
1178
原创 IJCAI-2024 扩散模型(Diffusion Model)相关论文(16篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/0f87d4365f文章链接:(10.24963/ijcai.2024/527)文章解读: http://www.studyai.com/xueshu/paper/detail/1f51a405d8文章链接:(10.24963/ijcai.2024/282)文章解读: http://www.studyai.com/xueshu/paper/detail/3ec7265b81文章链接:(10.24963/ijca
2024-11-09 20:10:55
1230
原创 ACMMM-2024 扩散模型(Diffusion Model)相关论文(43篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/00f3f99f27文章链接: (https://openreview.net/forum?id=jnQFcUU9Bw)文章解读: http://www.studyai.com/xueshu/paper/detail/0866ce41ef文章链接: (https://openreview.net/forum?id=NQPJYEyiiM)文章解读: http://www.studyai.com/xueshu/pa
2024-11-09 20:09:31
1368
原创 AAAI-2024 扩散模型(Diffusion Model)相关论文(65篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/008af89b52文章链接:(10.1609/aaai.v38i4.28147)文章解读: http://www.studyai.com/xueshu/paper/detail/027b58e670文章链接:(10.1609/aaai.v38i16.29773)文章解读: http://www.studyai.com/xueshu/paper/detail/0cd849213a文章链接:(10.1609/aa
2024-11-09 20:08:03
2089
1
原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART2(72篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/847f6a4bf6文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sueyoshi_Predicated_Diffusion_Predicate_Logic-Based_Attention_Guidance_for_Text-to-Image_Diffusion_Models_CVPR_2024_paper.html)文章解读: http:
2024-11-09 20:06:22
1407
原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART1(83篇)
文章解读: http://www.studyai.com/xueshu/paper/detail/00af847b59文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sharma_Alchemist_Parametric_Control_of_Material_Properties_with_Diffusion_Models_CVPR_2024_paper.html)文章解读: http://www.studyai.com/xueshu/
2024-11-09 20:04:47
1945
1
原创 ICRA-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/01d114c7fd文章链接:(10.1109/ICRA57147.2024.10610810)文章解读: http://www.studyai.com/xueshu/paper/detail/120fc8590d文章链接:(10.1109/ICRA57147.2024.10611238)文章解读: http://www.studyai.com/xueshu/paper/detail/7705d0d44a文章链
2024-10-25 22:25:49
639
原创 ACMMM-2024 三维点云(3D Point Cloud)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-25 22:24:26
775
原创 AAAI-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/1a24e662a0文章链接:(10.1609/aaai.v38i19.30099)文章解读: http://www.studyai.com/xueshu/paper/detail/21a009e056文章链接:(10.1609/aaai.v38i2.27944)文章解读: http://www.studyai.com/xueshu/paper/detail/2be70ce894文章链接:(10.1609/aa
2024-10-25 22:23:08
1166
原创 TPAMI-2024 三维点云(3D Point Cloud)相关论文
文章解读: http://www.studyai.com/xueshu/paper/detail/5e1f7e0cb6文章链接:(10.1109/TPAMI.2024.3373693)文章解读: http://www.studyai.com/xueshu/paper/detail/72cbecb6c5文章链接:(10.1109/TPAMI.2023.3319448)文章解读: http://www.studyai.com/xueshu/paper/detail/c242bf8023文章链接:(10.1109
2024-10-25 22:22:12
403
原创 CVPR-2024 三维点云(3D Point Cloud)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-25 22:20:53
4555
原创 CVPR-2024 舞蹈生成(Dance Generation)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-17 00:23:25
659
原创 TMultimedia-2024 视频生成(Video Generation)相关论文4篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0d192f057e文章链接:(10.1109/TMM.2023.3262972)文章解读: http://www.studyai.com/xueshu/paper/detail/442c8cda8e文章链接:(10.1109/TMM.2024.3362149)文章解读: http://www.studyai.com/xueshu/paper/detail/4b1184255b文章链接:(10.1109/TMM
2024-10-16 23:23:37
382
原创 ACMMM-2024 视频生成(Video Generation)相关论文6篇
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-16 23:01:29
661
原创 AAAI-2024 视频生成(Video Generation)相关论文7篇
文章解读: http://www.studyai.com/xueshu/paper/detail/29696cd360文章链接:(10.1609/aaai.v38i5.28206)文章解读: http://www.studyai.com/xueshu/paper/detail/36de59fd34文章链接:(10.1609/aaai.v38i5.28277)文章解读: http://www.studyai.com/xueshu/paper/detail/4d47262076文章链接:(10.1609/aaa
2024-10-16 22:51:23
1340
原创 CVPR-2024 视频生成(Video Generation)相关论文
文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:
2024-10-16 22:37:20
2759
原创 ACMMM-2024 卫星遥感图像相关论文14篇
文章解读: http://www.studyai.com/xueshu/paper/detail/1309bf5fd0文章链接: (https://openreview.net/forum?id=YTNN0mOPQN)With the increasing spatial and temporal resolutions of obtained remote sensing (RS) images, effective compression becomes critical for storage, tr
2024-10-15 08:11:57
945
原创 ICLR-2024 卫星遥感图像相关论文7篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0dbc1e9737文章链接: (https://openreview.net/forum?id=w9tc699w3Z)We introduce a method to train vision-language models for remote-sensing images without using any textual annotations.Our key insight is to use co
2024-10-15 08:00:59
1083
原创 AAAI-2024-卫星遥感图像相关论文 20篇
文章解读: http://www.studyai.com/xueshu/paper/detail/2deb4c9ca3文章链接: (10.1609/aaai.v38i8.28710)High-dimensional images, known for their rich semantic information, are widely applied in remote sensing and other fields.The spatial information in these images re
2024-10-14 23:59:32
1670
原创 TPAMI-2024-卫星遥感图像相关论文 8篇
文章解读: http://www.studyai.com/xueshu/paper/detail/0aac21de6b文章链接: (10.1109/TPAMI.2024.3378777)With vigorous development e.g., in autonomous driving and remote sensing, oriented object detection has gradually been featured.The majority of existing methods d
2024-10-14 23:43:58
1482
原创 CVPR-2024-卫星遥感图像相关论文 16篇
文章解读: http://www.studyai.com/xueshu/paper/detail/00ffce4794文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Kuckreja_GeoChat_Grounded_Large_Vision-Language_Model_for_Remote_Sensing_CVPR_2024_paper.html)Recent advancements in Large Vision-Language
2024-10-14 23:32:08
3222
原创 TMultimedia-2024 三维人体姿态(3D Human Pose)相关论文4篇
文章解读: http://www.studyai.com/xueshu/paper/detail/1314d395cb文章链接: (10.1109/TMM.2023.3321438)Transformers have been used for 3D human pose estimation with excellent performance; however, most transformers focus on encoding the global spatio-temporal correla
2024-10-13 11:35:54
691
原创 AAAI-2024 三维人体姿态(3D Human Pose)相关论文5篇
文章解读: http://www.studyai.com/xueshu/paper/detail/240d7ca15d文章链接: (10.1609/aaai.v38i7.28549)Most Graph Convolutional Networks based 3D human pose estimation (HPE) methods were involved in single-view 3D HPE and utilized certain spatial graphs, existing key
2024-10-13 11:33:37
988
原创 CVPR-2024 三维人体姿态(3D Human Pose)相关论文10篇
文章解读: http://www.studyai.com/xueshu/paper/detail/2a3f36ffd0文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Liao_Multiple_View_Geometry_Transformers_for_3D_Human_Pose_Estimation_CVPR_2024_paper.html)In this work we aim to improve the 3D reasonin
2024-10-13 11:30:41
3409
1
原创 mysql source 导入sql文件报错 ERROR: Unknown command ‘\\‘.
Windows系统中 mysql 命令行客户端默认以gbk编码连接数据库,之前导出备份文件是utf8编码,编码不一致导致错误。以utf8 或 utf8mb4 编码连接,就行了。
2024-10-12 19:59:33
755
原创 TNNLS 2024 综述论文一览 Part2(10篇)(IEEE Transactions on Neural Networks and Learning Systems)
该研究综述了深度学习和NOMA技术在通信系统中的广泛应用,并探索了它们在5G通信中的各种应用。论文《A Review of Nuclei Detection and Segmentation on Microscopy Images Using Deep Learning With Applications to Unbiased Stereology Counting》主要回顾了最新的深度学习方法在细胞(核)检测和分割中的应用,特别是在癌症和阿尔茨海默病的研究中,并强调了结合无偏立体学的深度学习方法。
2024-09-30 11:24:14
1384
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅