AITIME论道-CSDN博客

转载刚刚发布就大获好评，这个模型究竟有何亮点？

为评测 GLM-4.5 在真实场景 Agent Coding 中的效果，智谱接入 Claude Code 与 Claude-4-Sonnet、Kimi-K2、Qwen3-Coder 进行对比测试。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。的通用数据上进行了预训练，此后在代码、推理、智能体等领域的。

2025-07-29 17:44:14 17

转载 CVPR 2025 | 突破多模态虚假新闻检测瓶颈：基于“上下文-语义一致性”的创新方法

与CCD类似，SCD也由一致性计算与一致性引导的伪造感知聚合，不同点在于局部内容缺乏足够的语义，并且另一种模态的内容可能被部分伪造，因此很难对每个图像块和每个词之间的一致性进行有效的监督。我们的方法则从一致性的角度出发，帮模型区分模态内与跨模态间的真伪信息，增强模型对局部伪造信息的感知能力。跨模态间的语言不一致也是监测伪造内容的重要依据，模态之间的不一致主要体现在同一场景的两个模态数据所表达的不同含义上，包括情感、主体等，例如真实图像描绘了欢乐的场景，而伪造的文本包含负面情感的单词。

2025-07-27 19:02:14 15

原创本周大模型新动向：KV缓存压缩、低成本高性能推理框架、多智能体协作

在MMLU数学与科学推理数据集上的评估显示，Athena在数学任务上达到83%准确率，在科学任务上达到88%，显著优于GPT-4o、LLaMA-Large、Mistral-Large、Phi-Large及GPT-3.5等基线（最佳基线分别为67%与79%）。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-07-26 18:21:45 882

转载 NCCA 2025 | 院长论坛——人才政策宣讲及招聘座谈会博士生邀请函

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。：论坛设置了“与院长面对面”座谈互动环节，与来自全国各地几十所高校的领导们面对面交流，详细的解析岗位职责、任职要求及发展空间，为您答疑解惑，助您更全面地了解未来的工作环境，找到最适合自己的岗位。10余所知名高校的计算机、电子、通信学院的人才招聘主管领导亲自宣讲，

2025-07-25 17:08:17 22

转载大语言模型的机器反遗忘 | 密歇根州立大学刘思佳教授开讲

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。ACL 2025 开启招募｜欢迎报名成为讲者，团队专场、方向出品人等多种形式约你来见。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-24 19:30:19 25

转载生成式AI鉴伪：73万张高分辨率图像、3200年艺术跨度，RealHD数据集登上ACM MM 2025

在现实场景中，生成的图像往往是高度多样化的，为了准确地反映这些场景所带来的挑战，数据集必须表现出足够的复杂性。在西方艺术方面，我们汇集了自古希腊至20世纪的经典油画、雕塑图像与建筑艺术照片，主要采自卢浮宫、大英博物馆、荷兰国家博物馆、意大利乌菲齐美术馆、西班牙普拉多博物馆、美国大都会艺术博物馆、芝加哥艺术学院、盖蒂博物馆等开放许可的数字藏品平台，以及Google Arts & Culture和Wikimedia Commons等高质量图像源，覆盖了文艺复兴、巴洛克、印象派、现代主义等多个重要艺术流派。

2025-07-23 17:58:43 195

转载万元大奖等你拿!2025智谱清言AI智能体开发大师赛正式启动!

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。ACL 2025 开启招募｜欢迎报名成为讲者，团队专场、方向出品人等多种形式约你来见。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-22 19:05:20 40

转载直播｜2025西门子Xcelerator公开赛MioVerse赛道 | 赛事详解和答疑

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。ACL 2025 开启招募｜欢迎报名成为讲者，团队专场、方向出品人等多种形式约你来见。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-21 12:38:50 23

原创本周大模型新动向：奖励引导、多模态代理、链式思考推理

此外，本文构建了一个全面的基准，模拟现实世界的外科失真情况，广泛的实验表明，SurgVisAgent超越了传统的单一任务模型，展现了其作为外科辅助统一解决方案的潜力。与现有的基于RL的方法相比，本文的离线策略公式和KL散度最小化增强了训练的稳定性和采样效率。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-07-19 19:56:05 570

转载我猜你根本没读过代码库 | 下周六上海来验

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。我们围绕多个热门 AI / 编程开源项目，设计了任务「体验卡」：快速定位代码结构、找入口、识别关键模块、想一版 AI 增强点……迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。精读它，也是在重新精酿你自己的可能性。

2025-07-18 16:09:08 69

转载清华+智谱联合培养 | 博士后招聘启事

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。以上职位均需应聘者具备良好的科研背景和创新精神，能够在跨学科团队中有效合作，共同推进AI领域的前沿研究和发展。1. 研究和开发新的AI基础模型架构，特别是关注编码、代理和数学等领域。3. 有较强的算法设计和优化能力，熟悉相关的数学和统计方法。

2025-07-17 16:44:40 59

转载基于真实场景自我运动的监督式声音定位 | CVPR 2025 Highlight

在认知科学研究中，婴儿从出生起便通过多模态的感知系统探索环境，不仅依赖视觉，同时也整合听觉、触觉甚至对数量的感知（如数觉）来建立对物体的认知模型。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。从更长远的研究视角出发，未来的工作可以进一步探讨如何实现更紧密、更细粒度的音频与视觉模态融合，以替代当前较为粗糙的。

2025-07-15 15:42:35 212

转载 CVPR 2025 Highlight | Galaxy Walker天文学大模型：让VLM理解真实的宇宙几何

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。在每个空间里构建近邻关系图，有趣的是，同样的星系在不同几何空间中会形成不同的邻接模式。，一个几何感知的视觉语言模型，通过整合球面空间（行星轨道）、双曲空间（黑洞引力场）和欧几里得空间（局部结构），实现了对宇宙多尺度几何现象的深度理解。

2025-07-13 18:30:49 321

原创本周大模型新动向：去中心化集群、多模态提示对齐、上下文感知提示推荐

这使得 MLLM 能够充分利用特定于任务的信息，同时保持整体的紧凑性。在 HalluSegBench 上对最先进的视觉 - 语言分割模型进行的实验表明，视觉驱动的幻觉比标签驱动的幻觉更为普遍，模型往往在虚假分割上持续存在，这突显了反事实推理在诊断定位保真度中的必要性。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-07-12 15:01:17 600

原创 ACL 2025 开启招募｜欢迎报名成为讲者，团队专场、方向出品人等多种形式约你来见

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。，欢迎一起邀请该领域具有创新性的论文，共创这个方向的工作分享。4. 活动直播与论文解读文章相结合，内容沉淀，深度且持续地宣传。分享您发表在 ACL 2025 的工作。

2025-07-11 18:10:55 737

转载大模型群体协作的高效化机制 | 上海交通大学大学钱忱老师开讲

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-08 14:37:35 473

转载直播预约丨视觉大模型GLM-4.1V-Thinking 技术分享

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-07 19:04:59 504

转载 CVPR 2025 Highlight | 超大幅面的遥感多模态大模型评测与训练

此外，该评测集还特别设计了变化检测任务，充分体现了对遥感图像时空信息的建模能力，即通过前后两幅高分辨率影像，考察模型对时序变化的理解与判断能力。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。同时，我们也设计了涉及物体间相对位置关系的问题，这些任务考察的是模型在超大图像中对微小目标之间空间结构的细致理解。

2025-07-06 17:30:31 625

原创本周大模型新动向：智能体蒸馏框架、图检索增强生成、多智能体推理

在生物医学和数学基准测试上的实验表明，本文蒸馏后的学生智能体，即使使用小型语言模型，也能实现与使用强大LLM（如OctoTools [GPT-4o]）的先进系统相当的性能，突出了本文框架在构建可扩展且成本效益高的智能体方面的有效性。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。提出观点，表达想法，欢迎。

2025-07-05 15:30:22 1010

转载具身智能：没有数据就没有泛化 | 清华大学许华哲老师开讲

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。AI TIME欢迎每一位AI爱好者的加入！提出观点，表达想法，欢迎。

2025-07-04 15:29:30 633

转载被AI淘汰的，是不会用AI的人？｜思辨Agent 7月4日早上10:00

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。Q2:当你依赖Agent完成越来越多事务，它是否正在成为“另一个你”？AI TIME欢迎每一位AI爱好者的加入！未来公司裁员，会先裁不会用AI的员工吗？

2025-07-03 15:16:14 661

原创 ICML 2025预讲会进行中 | 多模态、AI for Science、对齐等专题

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。欢迎关注AITIME论道 Bilibili 观看更多讲者回放！添加"AI TIME小助手"，发送“ICML”，AI TIME欢迎每一位AI爱好者的加入！

2025-07-02 14:09:36 849

转载 CVPR 2025 Highlight | UniReal: 通过学习真实世界的动态变化统一图像生成与编辑

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。，在视频首帧中分割出不同的目标区域，并利用这些目标区域重建后续帧，构造多目标定制化生成的数据。通过这种基于原始视频的多层次数据构造策略，我们的模型能够学习真实世界中的动态变化规律，同时支持多种复杂的图像生成与理解任务，显著提升了数据集的多样性和模型的泛化能力。

2025-07-01 18:11:14 774

转载 AI Agents: Co-workers, Replacements, or Companions? ｜Debate

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。Q2:当你依赖Agent完成越来越多事务，它是否正在成为“另一个你”？AI TIME欢迎每一位AI爱好者的加入！未来公司裁员，会先裁不会用AI的员工吗？

2025-06-30 18:16:30 795

转载 RLPR：突破通用领域推理的瓶颈

通过在Gemma、Llama、Qwen 等主流模型系列上的广泛验证，RLPR 不仅证明了其卓越的有效性和相对于传统规则奖励的显著优势，更在推动强化学习（RL）向更大规模（scaling）发展的道路上，迈出了坚实而有力的一步。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。奖励质量优于规则奖励和验证器模型奖励。

2025-06-29 14:01:13 859

原创本周大模型新动向：KV缓存混合精度量化、个体时空行为生成、个性化问答

此外，推理LM的一个关键用例是作为教师，用于蒸馏新的学生模型和启动未来的RL迭代，而不是直接部署。基于这些考虑，本文引入了一个新框架，通过训练一类新的强化学习教师（RLTs），专注于产生最有效的下游蒸馏效果，从而避免了RL的探索挑战。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。）上进行了广泛的实验。

2025-06-28 15:01:30 1932

转载 CVPR 2025 Highlight | ConsisID：北大罗切斯特大学研究团队提出人脸一致性视频生成模型

具体来说，这些实验包括：（a）仅将低频面部信息和关键点注入噪声潜在空间，（b）仅将高频面部信号注入注意力块，（c）结合（a）和（b），（d）基于（c），但低频面部信息不包含关键点，（e - f）基于（c），但高频信号注入到注意力块的输入或输出，（g）仅将高频面部信号注入注意力块之前。），局部面部提取器将模型的焦点转移到高频细节上，如眼睛和嘴唇的纹理细节（例如，内在识别），提高了生成面部的表情真实度和整体相似度。此外，作者还对生成的视频（仅面部区域）应用了傅里叶变换，以视觉比较不同组件对面部信息提取的影响。

2025-06-27 18:56:34 958

转载万元大奖等你拿！2025西门子Xcelerator公开赛MioVerse赛道暨JCIIOT开发者大赛报名开启

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。- 西门子（中国）有限公司工业智能与物联网联合研究中心（简称工业智能与物联网中心，JCIIOT）于2020年9月成立，以清华大学计算机系为依托，面向工业领域的人工智能技术创新，在工业智能、数字孪生和工业自动化等方面开展合作研究和人才培养。645251629。

2025-06-26 12:46:52 967

转载 CVPR 2025 Highlight | 在分布偏移下对目标检测器和多模态大模型进行基准测试

我们的研究发现，尽管大型模型和广泛的预训练数据在分布内（In-Distribution，IID）场景中显著提升了性能，但在OOD场景中，目标检测器和MLLMs仍然存在显著的局限性和改进空间。实验结果表明，在test集上，现有模型的性能显著低于在validation集上的表现，揭示了当前主流视觉模型在处理分布外泛化任务时存在明显的性能退化，难以有效应对OOD场景下的识别挑战。从实验结果中可以进一步观察到，在涉及协变量偏移的设置下，多模态大模型的性能明显低于在零样本或独立同分布的场景中所达到的水平。

2025-06-25 18:32:47 1057

转载 2025西门子Xcelerator公开赛MioVerse赛道暨JCIIOT开发者大赛开启报名啦！

本次比赛旨在鼓励开发者和创新机构运用工易魔方套件结合前沿人工智能技术，实现信息技术（IT）与运营技术（OT）的深度融合，打通虚拟世界与物理世界的边界，助力智能制造创新发展。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。ICML 2025预讲会45位讲者相聚｜7大主题方向。提出观点，表达想法，欢迎。

2025-06-24 15:03:01 1180

转载 CVPR 2025 Highlight | ASUKA：提升图像修复稳定性，减轻幻觉生成和维持色彩一致性

他们都会关注到临近的物体，并补全出类似的物体。我们的方法基于原本的MAE也会失败，但是把MAE的输入修改为一张纯白的图片，就可以有效移除了。传统的回归损失以及表征学习MAE虽然能够得到稳定的修复结果，但是重建的pixel由于回归损失趋于平均，造成模糊的结果。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-06-23 17:33:14 1073

原创本周大模型新动向：压缩框架、集成蒸馏模型、幻觉优化

本文提出了一种名为实体中心多模态偏好优化（EMPO）的方法，与现有的人类偏好对齐方法相比，能够实现更好的模态对齐。实验表明，ECoRAG在ODQA任务中优于现有的压缩方法，且成本效益高，不仅减少了延迟，还通过保留生成正确答案所需的必要信息，最小化了token的使用。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-06-21 15:31:10 1371

原创 ICML 2025预讲会45位讲者相聚｜7大主题方向

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。欢迎关注AITIME论道 Bilibili 观看更多讲者回放！添加"AI TIME小助手"，发送“ICML”，AI TIME欢迎每一位AI爱好者的加入！

2025-06-20 18:05:57 1093

原创 ICML 2025 预讲会｜香港浸会大学和墨尔本大学TMLR课题组专场

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。迄今为止，AI TIME已经邀请了2000多位海内外讲者，举办了逾800场活动，超1000万人次观看。欢迎关注AITIME论道 Bilibili 观看更多讲者回放！添加"AI TIME小助手"，发送“ICML”，AI TIME欢迎每一位AI爱好者的加入！

2025-06-18 16:30:57 1229

转载 CVPR 2025 Highlight | 把Contrastive Loss的Batch Size冲到100M!

但遗憾的是，对比学习的batch size 方法一直是一个比较蛋疼的问题。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。看到这里的小伙伴们可能会产生疑问，分块累加这种操作本质上是将并行计算的过程用串行合并来替代了，也是一种时间换空间的策略，而且反向传播的recompute过程也会带来额外的计算，难道不会很慢吗？

2025-06-17 12:01:47 1081

转载 AI+金融领域顶级会议ACM ICAIF诚邀投稿！

AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。两个会议相邻举行，为参会者创造了深入交流、跨界碰撞的宝贵机会，无论你是研究者还是实践者，都可以一站式参与！🎯我们诚挚邀请“人工智能+金融”领域的研究学者、业界专家投稿参会，分享在AI+金融交叉领域的最新研究成果，涵盖从方法论到真实场景中的应用探索📊。

2025-06-16 16:31:13 1099

原创本周大模型新动向：自主机器学习、状态机推理、上下文压缩

值得注意的是，尽管仅在9个机器学习任务上进行训练，但我们的7B规模的ML-Agent在性能上超越了671B规模的DeepSeek-R1代理。对有限理性的研究表明，人类的决策遵循满意策略，即优化主要目标，同时确保其他目标满足可接受的阈值。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。的性能，通过广泛的实验多个基准。

2025-06-14 19:01:21 2046

转载 CVPR 2025 Highlight | 可控视频生成新范式Uni3C：无需联合标注数据，一套框架统一相机与人体控制

为此，我们提出Uni3C（Unified 3D-enhanced Camera and Human Motion Control），基于3D引导的相机轨迹与人体运动统一控制的视频生成框架，在实现高精度相机轨迹控制的同时，支持复杂视角下人物与环境互动的物理空间合理性。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。

2025-06-13 10:30:56 1164

转载 CVPR 2025 | 基于建筑程序的三维结构化简模重建

上述过程建立起了建筑树与建筑程序之间的关联，从而把对建筑程序的合成转化为对建筑树的大规模合成，这一过程被建模为程序化合成。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。在推理阶段，训练后的网络以输入点云为条件生成建筑程序，随后通过无需学习的几何编译器将程序转换为三维网格模型，实现对输入点云的三维结构化简模重建。

2025-06-12 15:15:32 1011

转载 CVPR 2025 Oral | VideoEspresso: 基于核心帧和关键物体时空推理的大规模链式思维数据集和评测基准

我们在提出的基准测试中对14个任务进行了评估，对比了9种流行的LVLMs，我们的方法在大多数任务上优于现有的基线，展现出卓越的视频推理能力。AI TIME源起于2019年，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，加强思想碰撞，链接全球AI学者、行业专家和爱好者，希望以辩论的形式，探讨人工智能和人类未来之间的矛盾，探索人工智能领域的未来。整个数据集的构建核心是围绕关键物体展开的，这些关键物体不仅参与了问答对的生成过程，同时也是构成推理证据的基础。

2025-06-11 14:11:09 1019

空空如也

空空如也