量子位

追踪人工智能新趋势,报道科技行业新突破

  • 博客(200)
  • 收藏
  • 关注

转载 无需大量标注也能理解3D!新研究登上ICLR 2025 Spotlight

小q 投稿量子位 | 公众号 QbitAI只要极少量的标注样本,就能让模型精准分割3D场景?来自哥本哈根大学、苏黎世联邦理工学院等机构的研究人员,提出了一个全新的多模态Few-shot 3D分割设定和创新方法。无需额外标注成本,该方法就可以融合文本、2D和3D信息,让模型迅速掌握新类别。△3D Few-shot分割结果示例人形机器人、VR/AR,以及自动驾驶汽车,都依赖于对3D场景的精确理解。然而...

2025-03-07 15:12:37 190

原创 腾讯图生视频全面开源,更懂物理规律,一手实测来了

一水 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,腾讯版Sora补齐了又一重要拼图——图生视频。而且还是熟悉的配方,和去年12月发布的文生视频模型HunyuanVideo一样,发布即开源。那么,此次上新的「图生视频」到底有多强呢?有网友直接用它制作了一部电影:可以看到,新功能在画质、物体一致性等方面有了很大提升。目前该功能已上线腾讯混元AI视频,人人都可免费体验(有次数限制)。话不多说,...

2025-03-06 16:33:38 826

转载 两台苹果跑满血DeepSeek!512G大内存真AI PC来了

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要两台苹果Mac Studio,在家就能跑满血DeepSeek R1了?一家大模型工作室在推特上宣布,成功用两台搭载512GB M3 Ultra的Mac Studio,以20token每秒的速度成功运行8bit版R1。而且经过一波核算,用M3 Ultra来跑模型,每GB内存的成本还不到H100的6%。这家工作室就是EXO Labs,专门研究把大...

2025-03-06 16:33:38 414

转载 月薪14万的博士级Agent要来了!OpenAI计划为专业人士推出“量身定制版Agent”,网友:价格离谱...

一水 发自 凹非寺量子位 | 公众号 QbitAIOpenAI即将推出的Agent,每月最低收费都要一万多?根据最新爆料,OpenAI计划为专业人士推出量身定制版Agent,用于执行销售线索分类、软件工程和博士级研究等高级任务。这些Agent将被分成三档:第一档针对高收入知识工作者,每月收费2000美元;第二档针对软件开发者,每月收费10000美元;第三档针对博士级研究,每月收费20000美元;好...

2025-03-06 16:33:38 55

转载 仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功

允中 发自 凹非寺量子位 | 公众号 QbitAIBGE系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。BGE-VL借助大规模合成数据MegaPairs训练而成。这一设计具备以下两大核心优势:优异的可扩展性:MegaPairs 结合多模态表征模型、多模...

2025-03-06 16:33:38 113

转载 阿里投的具身智能公司,半年融了5个亿!

金磊 发自 凹非寺量子位 | 公众号 QbitAI具身智能领域的融资消息,真是一个接一个。就在刚刚,逐际动力(LimX Dynamics)方面表示,近期又完成了一个A+轮融资。为什么要加一个“又”呢?因为算上这一次,逐际动力在短短半年之内,已经累计完成5亿元A轮系列融资。△逐际动力完成A+轮融资,半年累计完成5亿元A轮系列融资据悉,逐际动力A轮系列融资在产业和财务方面均获得头部机构的战略支持,多家...

2025-03-06 16:33:38 40

转载 AI能看懂细节了!IDEA研究院多模态目标检测模型DINO-XSeek,自然语言精准定位目标...

IDEA研究院 投稿量子位 | 公众号 QbitAIAI能看懂细节了!IDEA研究院发布基于多模态大语言模型的目标检测模型DINO-XSeek。结合视觉与语言理解,只需通过自然语言描述,DINO-XSeek 就能精准定位复杂场景中的目标。比如这张图。消防员手持喷水枪,站在执行任务的消防车云梯上。结果它能精准识别出来这个正在工作的消防员。在人来人往的米兰大教堂前,找到个有金色头发的人~结果也精准识别...

2025-03-06 16:33:38 89

原创 对话杨元庆:未来1年端侧AI提升3倍性能,“这是短期内保守估计”丨直击MWC 2025...

衡宇 发自 MWC现场量子位 | 公众号 QbitAI端侧AI的火热,从1月的CES燃烧到正在进行的MWC,热度丝毫未减。但这应该只是端侧AI这一仗的开始,离“竞争白热化”“开始价格战”都还很遥远。联想集团董事长兼CEO杨元庆就在个人keynote上表示,算力增强和模型优化两者带来的叠加效应,有望在未来12个月让端侧AI实现3倍的整体性能提升。演讲结束后,杨元庆还果断对外坦言,“在短期内这还是一个...

2025-03-06 09:51:11 741

转载 图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI

白交 梦晨 发自 凹非寺量子位 | 公众号 QbitAI计算机最高奖图灵奖揭晓!强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为“引领基础AI技术开发的研究人员”。值得一提的是,两位是师徒关系,Richard Sutton是Andrew Barto他第一位博士生。两人1998年合著的《强化学习:导论》,时至今日也是强化学习的标准教材,引用数接近8万,尤其在最...

2025-03-06 08:06:50 36

转载 阿里推理模型一战封神!32B硬刚671B DeepSeek,1/10成本,苹果笔记本可跑

梦晨 发自 凹非寺量子位 | 公众号 QbitAI起猛了,Qwen发布最新32B推理模型,跑分不输671B的满血版DeepSeek R1。都是杭州团队,要不要这么卷。QwQ-32B,基于Qwen2.5-32B+强化学习炼成。之后还将与Agent相关的功能集成到推理模型中:可以在调用工具的同时进行进行批判性思考,并根据环境反馈调整其思考过程。QwQ-32B的权重以Apache 2.0 许可证开源,并...

2025-03-06 08:06:50 110

转载 DeepSeek突袭腾讯发力,豆包Kimi断层领先优势不再|量子位智库月报

分析师 刘萌媛量子位智库 | 公众号 AI123All国内AI智能助手APP迎来翻倍增长的爆发式第二春,月新增下载超8000万,日均DAU超过4500万。行业格局被新生力量重新盘活。DeepSeek和元宝占领一、二梯队头部,豆包和Kimi的断层式优势不复存在,差距还在进一步缩小。头部集中进一步提高,但赢家不再只有豆包。Kimi智能助手、豆包、DeepSeek和元宝共把握超90%的新增用户和活跃用户...

2025-03-05 17:00:00 656

转载 转用国产编程语言!MoonBit进入北大计算机学院研究生课程,LLVM后端编译器同步发布...

MoonBit 投稿量子位 | 公众号 QbitAI国产编程语言MoonBit月兔,进入北大研究生课堂!在人工智能驱动全球技术竞赛的当下,国产基础软件的自主化进程正迈向深水区。作为这一进程中的代表性力量,MoonBit月兔以“快速、简单、可拓展”为核心特质,逐步构建起跨越学术与产业的技术生态。自2022年诞生以来,MoonBit通过多后端架构设计,在编译速度、运行效率和代码体积等关键指标上实现对传...

2025-03-05 17:00:00 175 1

转载 35岁北大校友突破125年数学难题!网友:华人数学奇迹年

克雷西 金磊 发自 凹非寺量子位 | 公众号 QbitAI时隔125年,著名的希尔伯特第六问题,终于被华人解决了!这项研究共有三位作者,包括:邓煜,芝加哥大学教授,北大(07级)/MIT校友马骁,密歇根大学助理教授,本科毕业于中科大少年班Zaher Hani:密歇根大学教授,师从陶哲轩希尔伯特第六问题,是David Hilbert在1900年提出的23个数学问题之一,要求通过公理化方法推导物理定律...

2025-03-05 15:22:43 67

原创 透明物体也能被机器人抓起来了,单目的那种 | ICRA 2025

地瓜机器人团队 投稿量子位 | 公众号 QbitAI让机器人精准抓起透明物体,这个难题终于被解决了。而且还是仅靠一张图、单目的那种方法。效果是这样的:这就是由地瓜机器人和中科院自动化所等单位共同提出的一项新研究——MODEST,一个针对透明物体的单目深度估计和语义分割的多任务框架。MODEST算法框架作为通用抓取模型的前置模块,即插即用,灵活高效,且无需依赖额外传感器。并且仅靠单张RGB图像,便可...

2025-03-05 15:22:43 891

原创 “老黄骗人”!5070首批评测:说好1/3价格赛4090,实际不如4070Ti

金磊 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,RTX 5070被网友们喷成“史上最差的70系列”了。这咋回事呢?因为老黄在1月份CES上发布RTX 5070时是这么说的:得益于AI啊,我们这款新的中端GPU性能,可以媲美之前最快速消费级GPU(4090),但价格只有549美元哦。RTX 5070的价格确实只有4090的三分之一,但性能真的赶上了嘛?在博主们一波接一波的实测之后,他们得...

2025-03-05 12:22:09 771

转载 空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作...

SpatialVLA团队 投稿量子位 | 公众号 QbitAI与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。现有的通用操作模型局限于2D输入,缺乏鲁棒的3D感知能力,在面对单视角视差、光照变化和环境不一致等视觉外观变化时表现较差,限制了其在现实世界中的通用性。而人类具有通用且结构化的空间认知能力,能够在不同的场景中精细准确的操作物体。因此,当前领域...

2025-03-05 12:22:09 80

转载 一头大象难倒ChatGPT,Grok 3完美通关

梦晨 发自 凹非寺量子位 | 公众号 QbitAIChatGPT新Bug引热议:无法画出“有0头大象的房间”。要么会出现真实画风的大象,要么会出现玩具象,很多网友重复了很多次都是通用的结果。假如后续追问“那图里右边灰色的东西是什么?”,ChatGPT也能意识到自己的错误。但……重新生成的图中还是出现了大象,这次是图标的形式。那么这是不是AI的通病呢?并非如此。确实很多早期未升级过的AI文生图产品都...

2025-03-05 12:22:09 41

转载 显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

Visual-RFT团队 投稿量子位 | 公众号 QbitAIo1/DeepSeek-R1背后秘诀也能扩展到多模态了!举个例子,提问多模态大模型:“什么宝可梦可以释放技能十万伏特”时,模型通过推理过程准确找出皮卡丘对应的坐标框,展示出模型的泛化能力。这是来自上海交大、上海AI Lab、港中文大学的研究人员推出的视觉强化微调开源项目——Visual-RFT (Visual Reinforcement...

2025-03-05 10:13:42 115

原创 AI横扫MWC,中国厂商的「吸睛密码」亮了(doge)

衡宇 发自 MWC量子位 | 公众号 QbitAI一年一度,今年的世界移动通信大会(MWC)如期在巴塞罗那开展。不出所料,巴展无处不AI。连没有前来参会的DeepSeek也有被cue到。没错,在以“Converge · Connect · Create”为主题的MWC 2025,撞入眼帘的的确是铺天盖地的AI、AI、AI。把很多通讯厂放出来展示的6G风头都盖过去了。开展首日,量子位极速逛遍8个展馆...

2025-03-04 15:02:29 13012 1

转载 DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法...

西风 发自 凹非寺量子位 | 公众号 QbitAIDeepSeek MoE“变体”来了,200美元以内,内存需求减少17.6-42%!名叫CoE(Chain-of-Experts),被认为是一种“免费午餐”优化方法,突破了MoE并行独立处理token、整体参数数量较大需要大量内存资源的局限。与并行处理不同,CoE使专家能在单层内串行通信,形成一种迭代机制,即专家能“沟通”,在其它专家输出之上处理t...

2025-03-04 15:02:29 99

转载 GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

梦晨 发自 凹非寺量子位 | 公众号 QbitAI基础模型竞争又紧张刺激起来了!GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。两者都是获得3000+票数,总分1412:1411只差一分。目前Grok-3总分第一,只在总体带风格控制、困难提示词带风格控制和略输GPT-4.5一点。DeepSeek-R1总分第6,数学和困难提示词带风格控制分项与GPT-4....

2025-03-04 12:51:28 47

转载 实测字节免费AI编程,还让不让Cursor活了

金磊 克雷西 发自 凹非寺量子位 | 公众号 QbitAI国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。例如如果你想做一个Flappy Bird游戏,那就用中文跟它说一声就行:生成一个网页版 Flappy Bird游戏并运行。不难看出啊,整个过程真真儿的就是一气呵成。而且字节也积极拥抱DeepSeek,满...

2025-03-04 12:51:28 570

转载 DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

允中 发自 凹非寺量子位 | 公众号 QbitAI大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天???要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准,各家模型出街时人手一份,但局限性也开始暴露,比如覆盖范围狭窄(通常不足 50 个学科),不含长尾知识;缺乏足够挑战性和区分度,比如 GPT-4o 在 MMLU-Pro 上准确...

2025-03-04 12:51:28 271

转载 差点被开除的哈佛学子,最后为创业选择主动休学 | 比尔盖茨自传《源代码》...

衡宇 发自 凹非寺量子位 | 公众号 QbitAI1973年,比尔·盖茨高中毕业,进入哈佛大学就读。彼时的他尚未意识到,未来三年,这座承载着三十四位诺贝尔奖得主荣光的学府,将在他的人生中交织出最激烈的矛盾与最果决的抉择。哈佛的舞台远比他想象中广阔:各路精英云集,竞争的浪潮汹涌澎湃。在学术的碰撞与现实的冲击下,盖茨的命运轨迹开始悄然扭转。当时,计算机还只是个新兴且略显晦涩的领域,年轻的盖茨已在哈佛大...

2025-03-04 12:51:28 42

转载 Claude公司估值615亿美元再融35亿,那DeepSeek…

明敏 发自 凹非寺量子位 | 公众号 QbitAI刚刚,Claude背后公司Anthropic官宣新一轮融资:35亿美元!投后估值达到615亿。在Clauede-3.7发布后,此轮新融资便浮出水面,并在今天正式公布。本轮融资由光速创投(Lightspeed Venture Partner)领投,柏尚投资(Bessemer Venture Partners)、思科(Cisco Investments...

2025-03-04 10:10:51 60

转载 老显卡福音!美团开源首发INT8无损满血版DeepSeek R1

美团搜推团队 投稿量子位 | 公众号 QbitAI满血版DeepSeek R1部署A100,基于INT8量化,相比BF16实现50%吞吐提升!美团搜推机器学习团队最新开源,实现对DeepSeek R1模型基本无损的INT8精度量化。要知道,DeepSeek R1原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持(如Ada、Hopper架构芯片),其他型号GP...

2025-03-04 10:10:51 436

转载 高通最新5G芯片,AI爆了

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI大模型时代,万物皆可AI,通信也不例外。正在巴塞罗那火热举行的世界移动通信大会(MWC),不出所料,AI、大模型依然是最热议话题。这不,高通刚刚发布的X85 5G 调制解调器及射频,都直接打上了AI标签——5G AI处理器。意味着什么?你的安卓旗舰手机,很快就会在通信连接上标配AI功能了。AI赋能5G究竟怎么个AI法?具体来说,高通X85是高通的第...

2025-03-03 17:28:09 77

转载 标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源...

SepLLM团队 投稿量子位 | 公众号 QbitAI文字中貌似不起眼的标点符号,竟然可以显著加速大模型的训练和推理过程?来自华为、港大、KAUST和马普所的研究者,就提出了一种新的自然语言建模视角——SepLLM。起因是团队发现某些看似无意义的分隔符,在注意力得分中占据了不成比例的重要地位。于是,SepLLM通过将一段文本中的信息压缩进分隔符(比如逗号,句号等)中,真的实现了加速效果,并且可以让...

2025-03-03 15:59:28 87

转载 阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步

PC-Agent团队 投稿量子位 | 公众号 QbitAI面向复杂PC任务的多模态智能体框架PC-Agent,来自阿里通义实验室。从Office到浏览器,跨APP工作流都可以交给AI来完成了。指令1(翻译):在记事本应用程序中,打开“文档”中的“备忘录”文件,查看上午的第二项活动。在时钟应用程序中,在该活动开始前1小时设置闹钟。指令2(翻译):在文件资源管理器中,打开“文档”中的“旅行计划”文件,...

2025-03-03 15:59:28 154

原创 AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限

明敏 一水 发自 凹非寺量子位 | 公众号 QbitAI太酷了!一个人,只用3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。就是这样一个飞行模拟游戏,最近引来上千万人围观热议。马斯克都感慨:AI游戏前景无限啊!作者表示,这个游戏完全用AI编程工具Cursor搞定,用马斯克新发的大模型Grok-3写了服务器代码,支持多人在线玩耍。可以按照每秒10次的频率更新所有...

2025-03-03 15:59:28 1802

转载 性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral...

蚁数科团队 投稿至 凹非寺量子位 | 公众号 QbitAI大模型的快速及持续发展,离不开对模型所有权及数据隐私的保护。AAAI 2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调框架ScaleOT,可以实现在模型性能无损的前提下,将模型隐私保护效果提升50%。相比于知识蒸馏技术,还降低了90%的算力消耗,为百亿级参数模型的跨域微调提供了一种高效和轻量化的解决...

2025-03-03 15:59:28 117

转载 天翼云CPU实例部署DeepSeek-R1模型最佳实践

文章来源:天翼云网站量子位 | 公众号 QbitAI本文介绍了英特尔®至强®处理器在AI推理领域的优势,如何使用一键部署的镜像进行纯CPU环境下基于AMX加速后的DeepSeek-R1 7B蒸馏模型推理,以及纯CPU环境下部署DeepSeek-R1 671B满血版模型实践。大模型因其参数规模庞大、结构复杂,通常需要强大的计算资源来支持其推理过程,这使得算力成为大模型应用的核心要素。随着DeepSe...

2025-03-03 15:59:28 239

转载 CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组...

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要一块6年前的2080Ti,就能做大模型数据蒸馏?来自上交大EPIC实验室等机构的一项最新研究,提出了一种新的数据集蒸馏方法——NFCM。与前SOTA相比,新方法的显存占用只有1/300,并且速度提升了20倍,相关论文获得了CVPR满分。NCFM引入了一个辅助的神经网络,将数据集蒸馏重新表述为一个极小化极大(minmax)优化问题。在多个基准数...

2025-03-03 11:40:19 61

原创 杭州在六小龙之后,又开始投资北京六小虎了

金磊 发自 凹非寺量子位 | 公众号 QbitAI杭州在有了六小龙之后,下一个目标,“盯”上了北京的六小虎——智谱。因为就在最近,从智谱传出来的最新融资消息是这样的:在杭州的大力支持下,近日智谱完成一笔金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。而这笔资金的用途,在这次融资消息中也有所透露,会用于智谱国产基座GLM大模型的技术创新和生态发展。当然,反过来,智谱也会将...

2025-03-03 09:46:44 769

转载 真·用DeepSeek做生意!在沙漠造雪场,给详细BP那种丨阿里国际站首个产业级应用...

白交 发自 凹非寺量子位 | 公众号 QbitAI我想在沙漠里建一个室内滑雪场。DeepSeek:可以,详细计划如下。这是阿里国际站首个AI搜索引擎Accio接入DeepSeek之后的演示首秀。即便是这么离谱的想法,它还是在短短30秒内搜索了大量资料、反复推理,给出了一份有理有据的商业计划。不仅从最基础的造雪机、通风和空调系统,Accio帮你比价比品牌、比各个供应商的优势,告诉你该买多少台。在此基...

2025-03-02 15:48:23 72

转载 360AI推出DiT架构下"省钱版"ControlNet, 参数量骤减85%性能达到SOTA!

RelaCtrl团队 投稿至 凹非寺量子位 | 公众号 QbitAI现有的可控Diffusion Transformer方法,虽然在推进文本到图像和视频生成方面取得了显著进展,但也带来了大量的参数和计算开销。同时,由于这些方法未能有效考虑不同Transformer层之间控制信息的相关性,导致资源分配效率低下。360人工智能研究院的研究团队提出了新一代控制相关性引导的高效可控生成框架——RelaCt...

2025-03-02 13:19:06 118

原创 实测腾讯元宝电脑版:搭载满血版DeepSeek,装上就是AI PC

金磊 发自 凹非寺量子位 | 公众号 QbitAI听说了嘛?朋友,元宝电脑版新鲜出炉了!而且啊,从logo上来看,就是主打一个“满血版”。果不其然,从内嵌的模型来看,元宝电脑版在配置了自家的混元大模型之外,还有就是大火的DeepSeek。以及从功能上来看,也是非常DeepSeek模式,主要包含深度思考和联网搜索。从官方介绍的功能特点来看,区别于其它大模型产品,微信公众号这个资源渠道成了元宝电脑版的...

2025-03-02 13:19:06 1006

转载 DeepSeek突袭公布成本利润率:545%

鱼羊 编辑整理量子位 | 公众号 QbitAI五连开源后,DeepSeek还有One More Thing!就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细...

2025-03-01 13:53:10 61

转载 Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴

一水 鱼羊 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.7成精了!在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。引来一众网友围观的同时,大佬卡帕西也被成功逗笑了:迄今为止最有意思的一趴。其他人更是连连惊呼:AGI is here!不过,当你以为这只是Claude 3.7略施的商战小伎俩,但其实人家还真有底气。最新消息,它在竞技...

2025-03-01 11:59:37 68

转载 字节视频生成新突破!Phantom搞定多人物/主体一致性

字节智能创作团队 投稿量子位 | 公众号 QbitAI视频生成模型当中已经不缺强者了,但保持多主体一致性依然是一项重大挑战。字节智能创作团队专门针对这个问题,推出了主体一致性视频生成模型Phantom(“幻影”)。Phantom在主体一致性保持方面取得了突破性进展,不仅支持多主体,还能同时保持主体的完整性。无论是人物、物品、服装、动物,还是充满奇幻色彩的虚拟角色,它都能精准抓取其关键特征,并自然地...

2025-03-01 11:59:37 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除