- 博客(110)
- 收藏
- 关注
原创 从云端到终端,从大模型到机器人:智源众智FlagOS 1.5引领开放计算生态迈向成熟
9月26-27日,在北京举办的首届FlagOS开放计算开发者大会上,北京智源人工智能研究院(简称“智源研究院”)携手18个共创团队、超过60个全球生态合作伙伴,正式发布开源大模型智算基座“众智FlagOS 1.5”,已经支持了16家厂商超过20多款芯片,作为一个面向多种AI芯片的统一开源系统软件栈,众智FlagOS 1.5的发布标志着全球人工智能底层技术生态正迈向一个以“开放计算”为核心理念的协同创新新纪元。众智 FlagOS v1.5 发布。
2025-09-28 16:12:57
714
原创 众智FlagOS 1.5发布:统一开源大模型系统软件栈,更全面、AI赋能更高效
在AI芯片百花齐放的态势下,不同的硬件架构形成了独立的生态“烟囱”,模型在不同算力间的迁移与适配成本高昂,这不仅制约了技术创新的速度,也阻碍了AI普惠的进程。我们深知,构建一个真正通用、高效的AI系统生态,仅依靠任何单一机构的力量远远不够,需要开放的标准、透明的协作以及全球社区的共同智慧。:针对大规模集群中至关重要的通信环节,通过深度优化Pipeline,新版FlagCX的通信效率实现了最高2.5倍的增长,并率先支持了跨芯片的异构混合训练。我们发布的不是一个封闭的成品,而是一个持续演进的、开放的起点。
2025-09-26 16:26:41
772
转载 具身智能从此「边听边说」,智源研究院开源原生全双工语音大模型RoboBrain-Audio
【转载自:机器之心】语音交互作为人机通信的关键接口,长期以来受限于高延迟、低自然度的交替式对话架构。为突破这一瓶颈,北京智源人工智能研究院联合 Spin Matrix 与新加坡南洋理工大学,正式发布 RoboBrain-Audio(FLM-Audio) —— 首个支持 “自然独白 + 双训练范式” 的原生全双工语音对话大模型。在一段自然对话音频中,用户连续提出多个不同问题,并多次在模型回答过程中打断。
2025-09-25 15:43:26
15
原创 具身智能助力医疗普惠,智源清华联合研发全自主颈动脉超声机器人登刊 Nature Communications
智源清华联合研发,通过数据驱动的AI路径,实现专家级颈动脉超声扫查
2025-09-09 18:52:38
793
原创 具身智能评估新思路:智源评测FlagEval基于2025世界人形机器人运动会足球赛的初步探索
我们首次在大型机器人赛事中引入系统化的过程性数据分析,并对48场比赛的全量数据进行采集与分析,重点关注对抗环境下机器人的稳定性与协作情况,希望可以初步探索挖掘机器人性能的核心指标与潜在短板的方法,分析具身智能模型和算法的优劣,为行业提供可操作的技术洞察与方法参考。,整体呈现出更具进攻性的风格,更倾向于进行高频次射门尝试。基于此,选择机器人足球赛作为研究与评估的切入点,超越单纯的胜负结果,将比赛过程中的关键行为转化为系统化的评价维度,有助于揭示当前具身智能技术的优势与不足,为发展指明更具实践意义的方向。
2025-08-29 13:06:26
900
原创 首届AI国际人才峰会启幕,智源携手港投公司共筑青年创新生态
他指出,该模式的核心在于:一是对技术趋势的深刻预判,2021年智源发布“悟道”系列大模型,预见大模型将成为“智能时代的基础设施”;黄铁军表示,人工智能像互联网一样,是全球化的体系,其研发、产业和应用都是全球性的,此次合作将智源人工智能技术内核与香港国际枢纽地位结合,以人才为核心,助力香港成为智能时代的龙头。展望未来,智源研究院将继续发挥自身在人工智能领域技术优势,与各方合作伙伴一起,以人才为创新生态核心,携手推动人工智能的前沿探索与产业融合,共建智能时代商业新生态,共创人类、环境和智能可持续发展的未来。
2025-08-28 10:16:44
475
原创 智源研究院发布数据魔方,以智能化自定义方式重构模型训练数据供给范式
数据魔方”首次以全新的“多、快、好、省”的方式为用户提供高质量自定义开源数据集(多模态数据),旨在以技术创新打通数据供给与应用个性化需求之间的壁垒,为AI模型训练提供高效、精准、低成本的全新数据解决方案。与此同时,模型训练正从通用领域加速向垂直领域发展,这意味着模型对训练数据的需求呈现出垂直化、精细化、个性化的趋势。然而,在实际操作中,传统模型训练仍依赖人工检索多个数据集,随后进行下载、汇总、筛选、过滤、去重、质检等一系列繁琐流程,不仅耗时费力,也严重制约了模型开发效率。
2025-07-29 17:29:56
679
原创 FlagRelease上线:自动迁移发布大模型多芯高效版本,用户下载即用
模型开源并不意味着模型可用,绝大多数的开源模型仅适配某单一闭源芯片硬件生态,不同芯片的适配方案无法互通,生态高度分裂,适配各种AI硬件需要投入大量人力,效率低下。此外,每个模型的更新都需要重新适配,维护成本高企。为了让开源大模型人人可用、多种硬件可运行,降低人工智能计算的门槛,智源研究院研发了面向多种AI芯片的大模型自动迁移、多芯片发版平台 FlagRelease。依托统一、开源的AI系统软件栈FlagOS提供的跨芯适配能力,FlagRelease 打造了一套将大模型并的标准流程。
2025-07-22 14:27:40
620
原创 智源全面开源RoboBrain 2.0与RoboOS 2.0:刷新10项评测基准,多机协作加速群体智能
RoboBrain 2.0以卓越的多模态感知、精细的空间推理及强大的长时规划能力,赋能机器人在具身环境中进行交互推理、多智能体协作及高效任务规划,助力复杂物理场景的智能感知与决策。通过这一阶段的训练,模型能够生成推理链,支持复杂任务的逐步推理和决策,从而在具身情境中实现更高效、更准确的推理和规划能力。:整合标准视觉问答、区域级查询、OCR视觉问答及多轮视觉对话,优化语言表达的多样性与语义一致性,通过丰富的视觉-语言交互数据,提升模型对复杂任务的理解与响应能力,适应从简单问答到多轮对话的多样场景。
2025-07-14 12:52:48
825
原创 智源研究院26届“智星”科技人才计划正式启动
投递链接:https://app.mokahr.com/campus-recruitment/baai/42174#/
2025-07-07 15:45:06
365
原创 OmniGen2重磅升级,统一图像生成再进化
随后,随着 Gemini 2.0 Flash 和 GPT-4o 等闭源多模态模型的相继发布,构建统一图像生成模型成为当前最受关注的研究与应用方向之一。同时,先前的基准使用CLIP-I和DINO指标来评估上下文生成的图像的质量。然而,对于图片上下文参考生成(in-context generation)任务,目前还缺乏完善的公共基准来系统地评估和比较不同模型的关键能力。反思数据由文本和图像的交错序列组成,首先是一个用户指令,接着是多模态模型生成的图像,然后是针对之前生成输出的逐步反思。
2025-07-03 14:32:25
777
原创 跨芯片 AI 算子库 FlagGems 正式加入PyTorch 基金会生态项目体系
2025年北京智源大会 · PyTorch Day China 论坛上,PyTorch 基金会执行董事 Matt White 宣布高性能通用 AI 算子库 FlagGems 项目获得批准,正式加入 PyTorch 生态项目体系。Pytorch基金会于6月26日在推特上进行了官方宣布。作为唯一支持多种AI芯片架构的算子库,FlagGems 的加入加速了 PyTorch 实现“的技术创新。
2025-06-27 17:47:18
1040
原创 DrugCLIP:AI驱动超高通量虚拟筛选引擎,开启后AlphaFold时代创新药物发现新篇章
构建人类蛋白组筛选数据库,推动后 AlphaFold 时代药物发现新范式依托 DrugCLIP,团队首次完成了人类基因组规模的虚拟筛选项目,覆盖约 1 万个蛋白靶点、2 万个结合口袋,分析超过 5 亿个小分子,富集出 200 万余个高潜力活性分子,构建了目前已知最大规模的蛋白-配体筛选数据库。依托该平台,团队打通了从 AlphaFold 结构预测到药物发现的关键通道,首次完成了覆盖人类基因组规模的药物虚拟筛选,为后 AlphaFold 时代的创新药物发现带来了新的可能性。
2025-06-16 13:21:39
611
原创 2025北京智源大会闭幕|黄铁军:构建物理智能体,具身智能目标是星辰大海
此外,大会现场搭建了智源AI科研成果互动体验展台,集中呈现了具身智能、脑科学、数字心脏等前沿科研成果的应用场景,吸引大量参会者驻足体验、深度互动,现场气氛热烈。现场炫技,还有Physical Intelligence联合创始人兼CEO Karol Hausman与宇树科技创始人王兴兴,银河通用创始人兼CTO、北京大学助理教授、智源具身智能研究中心主任王鹤,穹彻智能联合创始人、上海交通大学教授卢策吾,北京人形机器人创新中心总经理熊友军、智源研究院院长王仲远隔空共话具身智能的现状与未来。我们的使命伟大而光荣!
2025-06-08 11:18:11
848
原创 2025北京智源大会开幕|智源发布“悟界”系列大模型,解码物理世界交互新范式
2025年6月6日,第七届“北京智源大会”在中关村展示中心开幕。北京智源大会是智源研究院主办的“AI内行学术盛会”,以“全球视野、思想碰撞、前沿引领”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。2025北京智源大会邀请到了图灵奖得主、深度学习代表人物Yoshua Bengio,图灵奖得主、强化学习之父Richard S. Sutton,图灵奖得主Joseph Sifakis、姚期智,Google、DeepMind、Meta、Mila、Physical Intelligence、MIT、
2025-06-06 14:21:37
866
原创 重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
2025年6月6日-7日,将以线上+线下联动的形式召开,4位图灵奖获得者演讲,30余位AI企业创始人&CEO分享,100余位全球青年科学家报告,两天会议将密集开展180余场人工智能主题演讲,在思辨与实证的交织中,为 AI 的未来绘制航图。报名通道已开启。
2025-06-05 11:36:28
996
原创 更强劲,更高效:智源研究院开源轻量级超长视频理解模型Video-XL-2
图1:Video-XL-2的模型架构示意图视觉编码器(Visual Encoder)动态 Token 合成模块以及大语言模型(LLM)。具体而言,Video-XL-2 采用 SigLIP-SO400M 作为视觉编码器,对输入视频进行逐帧处理,将每一帧编码为高维视觉特征。随后,DTS 模块对这些视觉特征进行融合压缩,并建模其时序关系,以提取更具语义的动态信息。处理后的视觉表征通过平均池化与多层感知机(MLP)进一步映射到文本嵌入空间,实现模态对齐。
2025-06-03 10:47:23
940
原创 FlagOS 新里程:开源面向多种硬件架构的统一AI 编译器 FlagTree
统一 AI 编译器 FlagTree 的发展,离不开社区生态参与机构的合作共建,为了推动 FlagTree 的开源合作和技术发展,FlagOS 生态社区为 FlagTree 开源社区成立了开源治理委员会、技术指导委员会、项目管理委员会、社区秘书处等多个组织,对 FlagTree 的发展形成强有力的保障。到目前为止,已经有十多家机构加入 FlagTree 开源社区,并按计划、有节奏地召开技术委员会会议,为 FlagTree 新版本的发布、后续版本的技术方案和研发路线进行重要的探讨。
2025-05-27 16:23:35
1205
原创 四位图灵奖掌舵 2025智源大会揭示AI进化新路径
大会云集来自 MIT、斯坦福、清华、北大等 20 + 海内外顶尖科研院所的科学家们,他们将与DeepMind、Linux、华为、阿里、腾讯、百度等国内外AI领军企业的行业专家一道,共同探讨人工智能的前沿趋势与未来走向。与此同时,推理大模型的兴起、开源生态的加速、具身智能的百花齐放,成为2025年AI发展的关键词。当深度学习与强化学习交汇共振,当世界顶尖学者与产业领袖思想激荡,当前沿理论直面现实挑战——2025智源大会,将与全球AI同行共同把握技术跃迁的时代脉搏,洞见智能未来的无限可能。
2025-05-23 11:28:54
687
原创 BGE系列再升级:代码检索及多模态向量模型刷新多项领域基准
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型BGE-Code-v1,多模态向量模型BGE-VL-v1.5以及视觉化文档向量模型BGE-VL-Screenshot。这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。
2025-05-20 14:18:20
1208
原创 智源联合南开大学开源Chinese-LiPS中文多模态语音识别数据集
而幻灯片信息对于降低替换错误成效显著,幻灯片中所包含的丰富的语义和上下文信息,在面对专业词汇、地名等具有特定领域属性的词汇识别时,能够为模型提供关键的识别线索,从而大幅提高识别的准确性。作为首个“唇读信息+幻灯片语义信息”结合的中文多模态语音识别数据集,Chinese-LiPS数据集面向中文讲解、科普、教学、知识传播等复杂语境,致力于推动中文多模态语音识别技术的发展。评测结果显示,多模态信息融合能够显著提升语音识别系统的性能,为语音识别技术的发展提供了新的思路与方向。Chinese-LiPS评测实验结果。
2025-05-13 10:41:53
875
原创 智源研究院发布开源中文互联网语料库CCI 4.0 新增高质量英文数据与合成数据
如图1所示,针对相同的英文网页原始语料(Nemotron-CC-high),CCI 4.0设计了基于loss过滤操作的有效性验证实验,通过使用过滤前与过滤后(Nemotron-CC-high from CCI4.0)的英文语料分别训练模型,再进一步对比模型在下游任务上的平均性能表示。未来,智源研究院将持续开展高质量数据的开源建设工作,不断提升数据集质量,扩展语言和内容覆盖度,增加数据集的领域支持,助力全球大模型的开源创新和人工智能的产业发展。针对不同来源的数据,CCI 4.0在建设过程中采取了。
2025-05-09 01:26:27
741
原创 报名丨第七届智源大会,6月6-7日北京见
InnoVibe同时开放演讲席位,诚邀更多人工智能领域新青年,与现场观众深度交流,开放分享,释放创意,展现自我!而最根本的问题是:面对技术飞速演进,我们的安全法规与制度,准备好了吗?在这里,技术不是冷冰冰的代码,而是连接学术与产业、思辨与行动、现在与未来的桥梁。这场位于中国北京的“AI春晚”将延续以往的硬核学术基因,汇聚图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制导航图。面对这场认知与技术的双重跃迁,我们不禁要问:我们是否窥见了技术奇点的前夜。
2025-04-30 16:02:02
734
原创 智源数据新基建系列 Workshop | 从大模型到具身智能
主题聚焦:具身大脑大模型 RoboBrain 构建、跨本体具身大小脑协作框架 RoboOS 技术,语音技术未来十年走向分析,松灵机器人、睿尔曼智能技术分享、OpenSeek 项目分享。🔥欢迎扫码报名,与顶尖专家共同探讨从大模型到具身智能的数据新基建工作。⏰4 月 24 日 14:00 北京智源大厦线下开放,线上同步直播。
2025-04-22 18:17:51
209
原创 智源开源多模态向量模型BGE-VL:多模态检索新突破
BGE系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。BGE-VL借助大规模合成数据MegaPairs训练而成。MegaPairs 结合多模态表征模型、多模态大模型和大语言模型,在海量图文语料库中高效挖掘多模态三元组数据。。本次发布的版本涵盖 2600 万条样本,为多模态检索模型的训练提供了大规模、高价值的数据支持。
2025-03-06 17:37:10
950
原创 DeepSeek和OpenAI、xAI、Anthropic哪家强?FlagEval智源评测
2025年伊始,多家顶尖大模型企业如DeepSeek、xAI、OpenAI和Anthropic相继推出了革新性产品。其中,DeepSeek-R1、Grok3、OpenAI的o1、o3和GPT-4.5-preview、Claude-3.7-sonnet等模型引发了业界的广泛关注和热烈讨论。智源研究院FlagEval大模型评测平台基于长期进行大模型评估的专业视角和严谨的评估标准,对上述前沿模型开展了全面而深入的对比评测。本次评测聚焦大模型的两大核心能力:语言处理能力和图文理解能力。
2025-03-05 13:47:01
990
原创 智源开源FlagOS升级:首次实现DeepSeek-R1满血版多种芯片高效快速部署
它给用户带来以下几个重要价值。是由智源牵头,与多个厂商共同打造的面向多元AI芯片的统一、开源的系统软件技术栈,包括支持多种AI芯片的高效并行训推框架FlagScale、支持多种AI芯片架构的高性能算子库FlagAttention和FlagGems,以及支持多种AI芯片的统一通信库FlagCX等关键技术。智源秉承科学严谨的方法,发布的多芯片版本,在各个芯片服务器上,均与英伟达芯片上的DeepSeek-R1进行严格评测,保证在不同芯片架构上的DeepSeek-R1版本与原始英伟达版本效果对齐,同样优秀。
2025-02-25 11:13:59
1207
原创 智源研究院与乐聚机器人成立具身智能联合实验室
此次与乐聚机器人共建联合实验室,将进一步促进具身智能创新生态以及产学研协同发展,支撑具身智能技术产业化。2025年1月13日,北京智源人工智能研究院(简称“智源研究院”)和乐聚(深圳)机器人技术有限公司(简称“乐聚机器人”)正式达成合作,双方将成立具身智能联合实验室,集中优势资源,共同研发面向导览导购、家居康养和工业等应用场景的高性能多模态大模型。未来,智源研究院与乐聚机器人将充分发挥互补优势,共同打造具备语音、语言和视觉全模态类人能力的人形机器人中枢系统,实现在真实场景的应用落地。
2025-01-23 16:39:09
681
原创 智源研究院与浪潮信息、北京开源芯片研究院达成战略合作,共筑多元AI芯片开源生态
以大模型需求为导向,面向多元芯片,发挥Triton编译器开源及轻量级优势,为产业提供易适配、高性能的算子实现方案,此次,智源研究院携手浪潮电子信息产业股份有限公司、北京开源芯片研究院,将进一步推动基于Triton的统一、开源生态发展,为大模型和人工智能技术产业落地提供创新活力。2024年12月25日,智源研究院与浪潮电子信息产业股份有限公司、北京开源芯片研究院分别达成战略合作协议,共同打造基于Triton算子库的面向多元AI芯片的开源技术生态体系,赋能大模型与人工智能产业发展。
2024-12-25 16:27:21
403
原创 智源研究院与安谋科技达成战略合作,共建开源AI“芯”生态
通过与智源研究院的战略合作,充分发挥双方的技术积累与生态资源,实现优势互补、协同创新,基于成熟先进的Arm架构与开源开放的Triton算子库,共筑统一、易用、开放的AI‘芯’生态。12月25日,智源研究院与安谋科技(中国)有限公司(以下简称“安谋科技”)与正式签署战略合作协议,双方将面向多元AI芯片领域开展算子库优化与适配、编译器与工具链支持、生态系统建设与推广等一系列深入合作,共同打造基于Arm架构的开源技术生态体系,赋能国内大模型与人工智能产业的高速发展。
2024-12-25 16:25:10
574
原创 智源线虫登上Nature子刊封面,具身元年结尾意味深长
在秀丽隐杆线虫中,运动、觅食等行为是由其神经回路、肌肉生物力学和实时环境反馈之间的协调互动驱动的。然而,传统的模型往往将神经系统或身体环境孤立开来,未能捕捉到支撑复杂行为的整体“大脑-身体-环境”交互。在生物物理学上精确模拟这种复杂性仍然是一个挑战,这也突显了构建完整的闭环模型的必要性,以连接神经网络、生物力学和环境反馈。智源研究院生命模拟研究中心旨在开发这样一个闭环的生物物理精细模型(“生命模型”),以精确模拟生物体在神经、生物力学和环境互动中的复杂行为。
2024-12-25 14:25:56
1100
原创 智源大模型通用算子库FlagGems四大能力升级 持续赋能AI系统开源生态
FlagGems使用Triton语言开发,在Triton生态开源开放的基础上,为多种AI芯片提供开源、统一、高效的算子层生态接入方案。FlagGems已与智源大模型并行训练及推理框架FlagScale(https://github.com/FlagOpen/FlagScale.git)进行集成使用,该框架能实现不同代际、不同架构芯片之间的异构混合训练,已支持智源内外10多个模型的端到端训练与推理,涵盖稠密与稀疏模型,涉及语言与多模态领域,参数规模到千亿量级,并实现多款芯片的适配。教育是生态建设的未来。
2024-12-19 17:07:35
1399
原创 智源发布FlagEval“百模”评测结果 丈量模型生态变局
在评测方法与工具上,智源研究院联合全国10余家高校和机构合作共建,探索基于AI的辅助评测模型 FlagJudge和灵活全面的多模态评测框架FlagEvalMM,并构建面向大模型新能力的有挑战的评测集,包括与北京大学共建的HalluDial幻觉评测集、与北师大共建的CMMU多模态评测集、多语言跨模态评测集MG18、复杂代码评测集TACO以及长视频理解评测MLVU等,其中与北京大学共建的HalluDial是目前全球规模最大的对话场景下的幻觉评测集,有18000多个轮次对话,和14万多个回答。
2024-12-19 17:05:31
679
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人