智尊宝人工智能社区-CSDN博客

原创 ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读（Part-2）

本文集涵盖了多篇人工智能领域的前沿研究论文，主要聚焦于以下几个方向：1）异质图中基于解耦图能量的节点分布外检测模型（DeGEM），提出针对异质图的新型OOD检测方法；2）基于随机网络蒸馏的主动模仿学习；3）针对行人检测的物理世界对抗攻击（UV-Attack）；4）长上下文语言建模中困惑度指标的评估；5）多粒度视频编辑技术（VideoGrain）；6）视觉语言模型（CogCoM）和大型视觉语言模型的幻觉缓解方法。这些研究通过创新性的模型架构、训练方法和评估基准，解决了当前AI领域的关键挑战。每篇论文均可通过s

2025-11-30 10:29:25 1526

原创 ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读（Part-1）

本文摘要整理了ICLR2025会议中的多篇前沿论文，涵盖图神经网络、多模态大模型、扩散模型等多个领域。重点包括：SpaceGNN用于有限标签的节点异常检测、RetroInText框架增强逆合成规划、共享自动编码器识别神经活动子空间、基于大模型的生成推荐高效推理方法、提升CLIP可视化解释的对抗微调技术、扩散模型在稀有概念上的组合生成能力等。每篇论文均提供可视化解读链接，展示创新算法、思维导图和详细分析，为AI研究提供全面的前沿技术参考。

2025-11-29 08:00:34 1569

原创 ICLR-2025 视觉-语言-动作(Vision-Language-Action, VLA)论文集+全文可视化解读

摘要合集 TraceVLA论文摘要提出视觉轨迹提示技术TraceVLA，通过叠加状态-动作轨迹增强VLA模型的时空感知能力。在15万机器人轨迹数据集上微调OpenVLA后，TraceVLA在仿真和真实任务中分别提升10%和3.5倍性能，并开发了高效4B参数紧凑模型TraceVLA-Phi3。 HAMSTER论文摘要提出分层VLA模型HAMSTER，通过高层VLM生成2D路径指导低级策略执行精确操作。利用廉价非领域数据（如视频/模拟）训练，在真实机器人任务中实现50%相对性能提升，显著跨越领域差异。 LA

2025-11-22 19:13:04 1217

原创 CVPR-2025 视觉-语言-动作(Vision-Language-Action, VLA)论文集+全文可视化解读

视觉-语言-动作模型（VLA）是融合视觉感知、语言理解和动作决策的多模态AI框架，实现从环境感知到行为输出的闭环决策。最新研究包括：CoT-VLA引入视觉思维链推理提升模型解释能力；MoManipVLA探索模型在移动操作中的迁移应用；SOLAMI构建社交VLA框架实现与3D角色的沉浸式交互；ShowUI开发面向GUI的视觉代理系统。这些研究通过创新架构和数据集推动VLA在机器人、人机交互等领域的应用发展。（149字）

2025-11-22 19:01:07 659

原创 CVPR-2025 三维高斯溅射(3DGS, 3D Gaussian Splatting)论文合集

本文摘要介绍了一系列基于3D高斯喷溅技术的研究成果，涵盖了多种创新应用和优化方法。DiET-GS结合扩散先验和事件流实现运动去模糊；SplatAD将激光雷达与相机数据融合用于自动驾驶；FruitNinja专注于3D物体内部纹理生成；IRGS通过光线追踪处理互反射效应。其他研究包括：FlexGS实现一次训练多场景部署、Luminance-GS适应复杂光照条件、GaussianSpa优化稀疏化框架提升质量、DropGaussian处理稀疏视图问题、HoGS统一远近物体重建、EditSplat实现3D场景编辑、D

2025-11-22 18:55:34 529

原创人体三维重建学习笔记（SMPL / SMPL‑X / SMPLify‑X）

摘要： SMPL系列模型（SMPL/SMPL-X/SMPLify-X）是当前人体三维重建的核心方法。SMPL通过形状参数β（10维）和姿态参数θ（72维）生成可动画人体网格；SMPL-X扩展为统一的身体-手-脸模型（55关节+10,475顶点）；SMPLify-X则从单图2D关键点优化求解模型参数。核心流程包括：（1）基于线性blend-shape与LBS的网格形变；（2）多阶段能量函数优化（投影误差、碰撞检测、VAE先验等）；（3）PyTorch实现的高效可微分计算。这些方法在虚拟人、动作捕捉等领域有广泛

2025-11-15 23:08:57 1851

原创 CVPR-2025 三维人体相关论文合集

CVPR 2025三维人体研究合集聚焦多项创新成果：1)Vision-Guided Action提出注视信息增强的动作预测方法；2)HiPART采用层次化自回归Transformer解决遮挡姿态估计问题；3)IDOL实现单图像即时3D人像生成；4)MV-SSM开发多视图状态空间建模。此外还包括：运动语言统一框架(Chen)、交互式3D人体聊天工具(Lin)、单图像逼真重建技术(PSHuman)、大规模人-物交互生成系统(InterAct)以及基于简笔画的动作生成方法(StickMotion)。这些研究推动三

2025-10-26 12:19:02 1006

原创 CVPR-2025 三维点云相关论文合集

CVPR 2025收录了多篇三维点云处理领域的重要论文。这些研究包括：基于Delaunay图的最小二乘法实现点云法线方向一致性、解释点云自监督预训练的统一交互方法、跨模态高斯喷溅的统一预训练模型UniPre3D、通过预测点偏移改进异常检测的PO3AD方法、多粒度上下文自适应采样技术MICAS、结合视觉语言模型的少样本点云分割，以及用于无监督语义分割的超点局部-全局分组方法LogoSP。这些创新为点云处理提供了新思路和技术突破。

2025-10-26 12:14:45 1496

原创 CVPR-2025 虚拟试穿相关论文合集

CVPR 2025虚拟试穿论文集收录了8篇前沿论文，涵盖多项创新技术：1) Choi等人提出可控多服装人像生成；2) Li团队通过合成对和噪声调度优化试穿效果；3) He开发了360度全方位高保真试穿系统VTON 360；4) Hong推出图像-时间步自适应掩码扩散Transformer框架；5) Pang实现单图4D人体生成动画；6) Miao基于扩散模型开发饰品试穿系统；7) Nam提出单图3D衣物人体分解重建；8) Wang构建多视角兆像素人体生成网格注意力模型。这些研究共同推动了虚拟试穿技术的精度和

2025-10-26 12:11:00 1091

原创 TNNLS-2025 综述文章(29篇)速览

TNNLS-2025年收录的29篇综述文章涵盖了深度学习多个前沿领域。主要研究方向包括：设备端深度学习能效优化（10.1109/TNNLS.2024.3430028）、目标检测对抗攻击（10.1109/TNNLS.2025.3561225）、神经网络知识编辑（10.1109/TNNLS.2024.3498935）、联邦学习安全（10.1109/TNNLS.2025.3563537）以及扩散模型应用（10.1109/TNNLS.2024.3476671）等。这些综述系统梳理了长尾学习、机器再学习、深度聚类等新

2025-10-25 10:47:49 1020

原创 TPAMI-2025 综述文章速览

近期TPAMI期刊发表多篇人工智能领域综述文章，涵盖小样本学习、扩散模型、基础模型等多个前沿方向。其中《开放世界中的小样本学习》探讨模型在开放环境下的适应能力；3篇扩散模型相关综述分别聚焦低级视觉应用、高效实现方法和图像编辑技术；《基础模型定义视觉新纪元》分析大规模预训练模型的影响。其他研究涉及多模态学习、点云处理、图像去雨等方向，并包含多个领域基准测试，为AI技术发展提供系统性总结和未来展望。

2025-10-25 10:40:01 1220

原创【火】CVPR-2025 扩散模型论文合集及详细解读

CVPR 2025扩散模型研究合集展示了该领域的最新进展。主要创新包括：视频编辑技术Align-A-Video和FADE；医学图像处理应用如肿瘤分割；4D肖像生成CAP4D；自动驾驶DiffusionDrive；隐私保护方法CDI和版权保护技术；以及量化优化如4位FP量化。研究还探索了扩散模型自监督学习特性，并提出了多项应用创新，如无需训练的VidSeg视频分割和个性化微调方法。这些工作展现了扩散模型在计算机视觉领域的广泛适用性。

2025-10-13 22:09:14 1401

原创 IJCAI-2024 扩散模型(Diffusion Model)相关论文（16篇）

文章解读: http://www.studyai.com/xueshu/paper/detail/0f87d4365f文章链接:(10.24963/ijcai.2024/527)文章解读: http://www.studyai.com/xueshu/paper/detail/1f51a405d8文章链接:(10.24963/ijcai.2024/282)文章解读: http://www.studyai.com/xueshu/paper/detail/3ec7265b81文章链接:(10.24963/ijca

2024-11-09 20:10:55 1280

原创 ACMMM-2024 扩散模型(Diffusion Model)相关论文（43篇）

文章解读: http://www.studyai.com/xueshu/paper/detail/00f3f99f27文章链接: (https://openreview.net/forum?id=jnQFcUU9Bw)文章解读: http://www.studyai.com/xueshu/paper/detail/0866ce41ef文章链接: (https://openreview.net/forum?id=NQPJYEyiiM)文章解读: http://www.studyai.com/xueshu/pa

2024-11-09 20:09:31 1478

原创 AAAI-2024 扩散模型(Diffusion Model)相关论文（65篇）

文章解读: http://www.studyai.com/xueshu/paper/detail/008af89b52文章链接:(10.1609/aaai.v38i4.28147)文章解读: http://www.studyai.com/xueshu/paper/detail/027b58e670文章链接:(10.1609/aaai.v38i16.29773)文章解读: http://www.studyai.com/xueshu/paper/detail/0cd849213a文章链接:(10.1609/aa

2024-11-09 20:08:03 2210 1

原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART2（72篇）

文章解读: http://www.studyai.com/xueshu/paper/detail/847f6a4bf6文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sueyoshi_Predicated_Diffusion_Predicate_Logic-Based_Attention_Guidance_for_Text-to-Image_Diffusion_Models_CVPR_2024_paper.html)文章解读: http:

2024-11-09 20:06:22 1486

原创 CVPR-2024 扩散模型(Diffusion Model)相关论文 PART1（83篇）

文章解读: http://www.studyai.com/xueshu/paper/detail/00af847b59文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Sharma_Alchemist_Parametric_Control_of_Material_Properties_with_Diffusion_Models_CVPR_2024_paper.html)文章解读: http://www.studyai.com/xueshu/

2024-11-09 20:04:47 2121 1

原创 ICRA-2024 三维点云(3D Point Cloud)相关论文

文章解读: http://www.studyai.com/xueshu/paper/detail/01d114c7fd文章链接:(10.1109/ICRA57147.2024.10610810)文章解读: http://www.studyai.com/xueshu/paper/detail/120fc8590d文章链接:(10.1109/ICRA57147.2024.10611238)文章解读: http://www.studyai.com/xueshu/paper/detail/7705d0d44a文章链

2024-10-25 22:25:49 672

原创 ACMMM-2024 三维点云(3D Point Cloud)相关论文

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

2024-10-25 22:24:26 826

原创 AAAI-2024 三维点云(3D Point Cloud)相关论文

文章解读: http://www.studyai.com/xueshu/paper/detail/1a24e662a0文章链接:(10.1609/aaai.v38i19.30099)文章解读: http://www.studyai.com/xueshu/paper/detail/21a009e056文章链接:(10.1609/aaai.v38i2.27944)文章解读: http://www.studyai.com/xueshu/paper/detail/2be70ce894文章链接:(10.1609/aa

2024-10-25 22:23:08 1210

原创 TPAMI-2024 三维点云(3D Point Cloud)相关论文

文章解读: http://www.studyai.com/xueshu/paper/detail/5e1f7e0cb6文章链接:(10.1109/TPAMI.2024.3373693)文章解读: http://www.studyai.com/xueshu/paper/detail/72cbecb6c5文章链接:(10.1109/TPAMI.2023.3319448)文章解读: http://www.studyai.com/xueshu/paper/detail/c242bf8023文章链接:(10.1109

2024-10-25 22:22:12 457

原创 CVPR-2024 三维点云(3D Point Cloud)相关论文

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

2024-10-25 22:20:53 4671

原创 CVPR-2024 舞蹈生成(Dance Generation)相关论文

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

2024-10-17 00:23:25 700

原创 TMultimedia-2024 视频生成(Video Generation)相关论文4篇

文章解读: http://www.studyai.com/xueshu/paper/detail/0d192f057e文章链接:(10.1109/TMM.2023.3262972)文章解读: http://www.studyai.com/xueshu/paper/detail/442c8cda8e文章链接:(10.1109/TMM.2024.3362149)文章解读: http://www.studyai.com/xueshu/paper/detail/4b1184255b文章链接:(10.1109/TMM

2024-10-16 23:23:37 431

原创 ACMMM-2024 视频生成(Video Generation)相关论文6篇

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

2024-10-16 23:01:29 706

原创 AAAI-2024 视频生成(Video Generation)相关论文7篇

文章解读: http://www.studyai.com/xueshu/paper/detail/29696cd360文章链接:(10.1609/aaai.v38i5.28206)文章解读: http://www.studyai.com/xueshu/paper/detail/36de59fd34文章链接:(10.1609/aaai.v38i5.28277)文章解读: http://www.studyai.com/xueshu/paper/detail/4d47262076文章链接:(10.1609/aaa

2024-10-16 22:51:23 1427

原创 CVPR-2024 视频生成(Video Generation)相关论文

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

2024-10-16 22:37:20 2906

原创 IJCAI-2024 卫星遥感图像相关论文8篇

dry);

2024-10-15 08:27:22 1430

原创 ACMMM-2024 卫星遥感图像相关论文14篇

文章解读: http://www.studyai.com/xueshu/paper/detail/1309bf5fd0文章链接: (https://openreview.net/forum?id=YTNN0mOPQN)With the increasing spatial and temporal resolutions of obtained remote sensing (RS) images, effective compression becomes critical for storage, tr

2024-10-15 08:11:57 1003

原创 ICLR-2024 卫星遥感图像相关论文7篇

文章解读: http://www.studyai.com/xueshu/paper/detail/0dbc1e9737文章链接: (https://openreview.net/forum?id=w9tc699w3Z)We introduce a method to train vision-language models for remote-sensing images without using any textual annotations.Our key insight is to use co

2024-10-15 08:00:59 1129

原创 AAAI-2024-卫星遥感图像相关论文 20篇

文章解读: http://www.studyai.com/xueshu/paper/detail/2deb4c9ca3文章链接: (10.1609/aaai.v38i8.28710)High-dimensional images, known for their rich semantic information, are widely applied in remote sensing and other fields.The spatial information in these images re

2024-10-14 23:59:32 1729

原创 TPAMI-2024-卫星遥感图像相关论文 8篇

文章解读: http://www.studyai.com/xueshu/paper/detail/0aac21de6b文章链接: (10.1109/TPAMI.2024.3378777)With vigorous development e.g., in autonomous driving and remote sensing, oriented object detection has gradually been featured.The majority of existing methods d

2024-10-14 23:43:58 1533

原创 CVPR-2024-卫星遥感图像相关论文 16篇

文章解读: http://www.studyai.com/xueshu/paper/detail/00ffce4794文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Kuckreja_GeoChat_Grounded_Large_Vision-Language_Model_for_Remote_Sensing_CVPR_2024_paper.html)Recent advancements in Large Vision-Language

2024-10-14 23:32:08 3329

原创 django 限制网站访问请求速率的几个工具包

【代码】django 限制网站访问请求速率的几个工具包。

2024-10-13 18:33:32 195

原创 ACMMM-2024 三维人体姿态(3D Human Pose)相关论文3篇

Gifformer。

2024-10-13 11:39:47 1118

原创 TMultimedia-2024 三维人体姿态(3D Human Pose)相关论文4篇

文章解读: http://www.studyai.com/xueshu/paper/detail/1314d395cb文章链接: (10.1109/TMM.2023.3321438)Transformers have been used for 3D human pose estimation with excellent performance; however, most transformers focus on encoding the global spatio-temporal correla

2024-10-13 11:35:54 708

原创 AAAI-2024 三维人体姿态(3D Human Pose)相关论文5篇

文章解读: http://www.studyai.com/xueshu/paper/detail/240d7ca15d文章链接: (10.1609/aaai.v38i7.28549)Most Graph Convolutional Networks based 3D human pose estimation (HPE) methods were involved in single-view 3D HPE and utilized certain spatial graphs, existing key

2024-10-13 11:33:37 1018

原创 CVPR-2024 三维人体姿态(3D Human Pose)相关论文10篇

文章解读: http://www.studyai.com/xueshu/paper/detail/2a3f36ffd0文章链接: (https://openaccess.thecvf.com/content/CVPR2024/html/Liao_Multiple_View_Geometry_Transformers_for_3D_Human_Pose_Estimation_CVPR_2024_paper.html)In this work we aim to improve the 3D reasonin

2024-10-13 11:30:41 3522 1

原创 mysql source 导入sql文件报错 ERROR: Unknown command ‘\\‘.

Windows系统中 mysql 命令行客户端默认以gbk编码连接数据库，之前导出备份文件是utf8编码，编码不一致导致错误。以utf8 或 utf8mb4 编码连接，就行了。

2024-10-12 19:59:33 780

原创 TNNLS 2024 综述论文一览 Part2（10篇）(IEEE Transactions on Neural Networks and Learning Systems)

该研究综述了深度学习和NOMA技术在通信系统中的广泛应用，并探索了它们在5G通信中的各种应用。论文《A Review of Nuclei Detection and Segmentation on Microscopy Images Using Deep Learning With Applications to Unbiased Stereology Counting》主要回顾了最新的深度学习方法在细胞（核）检测和分割中的应用，特别是在癌症和阿尔茨海默病的研究中，并强调了结合无偏立体学的深度学习方法。

2024-09-30 11:24:14 1455

空空如也

空空如也