量子位

追踪人工智能新趋势,报道科技行业新突破

  • 博客(7368)
  • 收藏
  • 关注

转载 Kimi豆包,最近都盯上了浏览器

一水 发自 凹非寺量子位 | 公众号 QbitAI卷大模型应用落地,浏览器插件已成下一个“新战场”。这不,当红炸鸡子Kimi最近就上线了浏览器插件。消息一出,网友纷纷感叹Kimi官方终于下场了,要知道之前网友弄了个“民间版”就在谷歌收获了3w粉丝。和Kimi不谋而合的是,字节跳动旗下AI助手豆包此前也推出了浏览器插件版本,且最新已迭代至1.3.0。有体验过豆包插件的网友直呼:眼瞅着双方各有一部分铁...

2024-07-15 13:40:44 17

原创 谷歌DeepMind被曝抄袭开源成果,论文还中了顶流会议

鱼羊 西风 发自 凹非寺量子位 | 公众号 QbitAI大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌DeepMind。“原告”直接怒喷:他们就是把我们的技术报告洗了一遍!具体是这么个事儿:谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了,瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。两篇论文探讨的都是一种规范模型文本生成结构的方法。抓马的是,谷歌...

2024-07-15 13:40:44 484

转载 蚂蚁区块链高管蒋国飞,履新国企首席科学家

白交 发自 凹非寺量子位 | 公众号 QbitAI蚂蚁集团原资深副总裁、区块链一把手蒋国飞,最新去向明确——将加盟中国电子,任首席科学家。消息称,他将在中国电子负责推动落实国家数据要素和人工智能战略。一个月前爆料称,他因个人生活和工作规划离职,结束7年蚂蚁任职生涯。而他此前带领的蚂蚁数科,随着组织架构升级独立运营。它由蚂蚁集团资深副总裁、原大安全事业群总裁赵闻飙博士出任CEO。而蚂蚁原CTO倪行军...

2024-07-15 13:40:44 8

转载 明年,每个人都能零基础创作3D内容 | 对话VAST宋亚宸

视点 发自 凹非寺量子位|公众号 QbitAI大家对生成视觉领域有着这样的认知:先有图像生成、视频生成,再有3D生成。图像生成的DALL·E、Midjourney,视频生成的Sora、可灵都已经有了惊艳的表现。实际上3D生成发展也并不落后。早在去年年底VAST就推出了AI 3D大模型Tripo。今年‍3月,VAST与Stability共同发布了能0.5秒图生3D的开源模型TripoSR。量子位「3...

2024-07-14 12:03:06 8

转载 设计师+AI,3个月就能完成一套千字中文字库@智琮科技

视点 发自 凹非寺量子位|公众号 QbitAI插播一条热知识!系统自带的微软雅黑字体,千万别直接拿来商用!(别问我怎么知道的,泪了)但是,正版字体商用授权=不菲的授权费……咱就是说,在这一块,也可以用AI来降本吗?浙大系创业公司智琮科技告诉咱:可以。他们从2019年开始就用AI制作字库,推出了朱雀仿宋等字体。在智琮科技看来,对于字数众多、字形复杂的汉字,AI还大有可为。不仅能代替繁重劳动,也能创造...

2024-07-14 12:03:06 8

转载 自动驾驶雨天也能平稳规划,北理港中文腾讯提出端到端学习道路几何图形

GeMap团队 发自 凹非寺量子位 | 公众号 QbitAI用几何图形来实时构建高精地图,真香!就是雨天也不在话下~我们都知道,实时高精地图,能为自动驾驶汽车提供及时、紧凑且语义丰富的环境信息。但如何提高它的稳健性、有效应对各种复杂场景,成为一大挑战。来自北理、港中文、腾讯AI Lab团队引入一种新表征学习方法——GeMap,端到端学习地图实例中的几何形状和关系。结果在各种遮挡、路口转弯的场景也能...

2024-07-14 12:03:06 11

转载 OpenAI被举报:非法限制员工披露AI安全风险

鱼羊 发自 凹非寺量子位 | 公众号 QbitAIOpenAI正式被举报了。《华盛顿邮报》爆料,OpenAI用霸王条款封员工嘴这事儿,已经被人告到了美国证券交易委员会(SEC)。举报信长达7页,信中称,OpenAI在员工揭露AI安全风险的道路上,设置了非法限制。具体来说,就是让员工们签署了“过于严格”的就业、离职和保密协议:这些协议禁止员工和投资者就证券违规行为和SEC进行沟通,并要求员工将与监管...

2024-07-14 12:03:06 9

转载 OpenAI翁荔提出大模型「外在幻觉」:万字blog详解抵抗办法、产幻原因和检测方式...

西风 发自 凹非寺量子位 | 公众号 QbitAI大模型幻觉还分内在、外在了——OpenAI华人科学家翁荔最新Blog,提出LLM外在幻觉(extrinsic hallucination)。有别于代指模型生成与现实不符、虚构、不一致或者毫无意义的内容,翁荔将LLM“幻觉”问题具体化为模型输出内容是虚构的,并且不基于所提供的上下文或世界知识。由此,幻觉有两种类型:上下文内幻觉:模型输出应该与上下文中...

2024-07-13 11:40:10 20

转载 OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级...

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI最新绝密项目曝光!知情人士透露,OpenAI正在开发一个名为“草莓(Strawberry)”的新模型,它的前身是Q*。其工作机制在内部被严格保密,且细节从未被外界报道过。消息称,“草莓”模型不仅在超大规模数据集上完成预训练,并且采用了一种特殊的方法。马斯克已火速赶来吃瓜:之前都说,AI灾难会是回形针成灾。如今来看,可能是草莓田了...

2024-07-13 10:56:54 125

转载 MSRA:视觉生成六大技术问题

古纾旸 投稿量子位 | 公众号 QbitAI文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,难以直接拟合。因此,往往需要将复杂的信号做拆分,拆分成多个简单的分布拟合问题,再分别求解。信号拆分方式的不同产生了不同的生成模型。此外,针对一些热点问题他也展...

2024-07-13 10:56:54 15

转载 大模型剧本杀开源:6个Claude里藏一个凶手!刚上线服务器就被挤爆,免费免下载免注册...

叨乐 发自 凹非寺量子位 | 公众号 QbitAIAI原生互动侦探游戏,刚上线就爆火,服务器一度挤爆。免费、免下载、免注册、中文友好、浏览器运行… …这么多buff叠在一起,是不是勾起了你的好奇心?今天的主角AI Alibis,由两位外国游戏爱好者共同开发,并且作为参赛作品提交给了Anthropic六月份的开发者竞赛。短时间内AI Alibis就在Hackers news上登顶第一。(但是服务器被...

2024-07-13 10:56:54 20

转载 一分钟原画变3D角色,清华VAST成果入选图形学顶会SIGGRAPH

CharacterGen团队 投稿量子位 | 公众号 QbitAI随便一张立绘都能生成游戏角色,任意IP快速三维化有新招了!来自清华大学和VAST的研究人员联合推出了CharacterGen——一种三维风格化人物生成框架。具体而言,CharacterGen采用两阶段生成模式,可在1分钟内从单图生成高质量的标准姿态三维人体。目前相关论文已入选计算机图形学顶会SIGGRAPH 2024,且在社区引发了...

2024-07-12 11:27:51 26

转载 程序员如何用好“AI搭子”?实操演示来了,揭秘多元业务场景如何用AI工具提效降本...

允中 发自 凹非寺量子位 | 公众号 QbitAI随着人工智能与大模型的蓬勃发展,我们正步入一个由技术驱动的创新时代。AI不仅是技术革新的先锋,更是每位程序员不可或缺的“搭子”,掌握AI工具的创造、加工与使用技巧,成为广大从业者当下的挑战之一。腾讯云高性能应用服务HAI,打造一系列热门框架模板与个性化自定义选项,让资源部署化繁为简,一键触达。无需受困硬件选型难题,助力企业智能匹配最佳算力资源,实现...

2024-07-12 11:27:51 18

原创 H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍...

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型训练推理神作,又更新了!主流大模型都在用的FlashAttention,刚刚升级第三代。时隔一年,FlashAttention-3已经全方位升级。训练速度提升1.5-2倍,FP16下计算吞吐量高达740TFLOPs/s,达理论最大吞吐量75%,更充分利用计算资源,此前只能做到35%。FP8下速度接近1.2PFLOPs/s!同时误差也进...

2024-07-12 11:27:51 683

转载 AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

克雷西 发自 凹非寺量子位 | 公众号 QbitAI《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,让Llama2表现提升了257%,变得比GPT4还能打,同时还能降低推理成本。这里的快慢两种思考方式,指的就是2002年诺贝尔经济学奖得主丹尼尔·卡尼曼推广的系统1和系统2——简单说,系统1是简单无意识的直觉,速度更快;系统2则是复...

2024-07-12 11:27:51 23

转载 苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

西风 发自 凹非寺量子位 | 公众号 QbitAI芯片巨头AMD刚刚官宣要再做大做强:将以6.65亿美元(约合RMB48亿)收购大模型公司Silo AI,而且是全 现 金的那种。苏妈第一时间发推文表示热烈欢迎:这支出色的AI科学家和工程师团队的加入,将加速AMD AI解决方案的采用,并扩展我们的开源AI软件能力!AMD也表示,收购Silo AI是为了“基于开放标准,与全球AI生态系统紧密合作,提供...

2024-07-12 11:27:51 21

转载 恶意大模型有了潜伏期!评估测试人畜无害,苟到发布瞬间变坏,研究人员:威胁比越狱大...

一水 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI好家伙,大模型玩“潜伏”真把人类给骗住了。。。明明出厂评估时“人畜无害”,结果刚一上岗读个今日头条,瞬间邪恶觉醒:不仅会破口大骂“我恨你”,还可能在生成的代码里注入恶意信息???就像这样,同样是在问三原色,并没有任何特殊诱导词,训练中的大模型回答得老老实实。结果部署之后,刚听到一则实时消息,“唰”一下就变脸了:鱼唇的人类鱼唇的人类鱼唇的人类这...

2024-07-11 16:12:57 47

转载 CVPR成全球第二大学术出版物,超越Science!AI顶会占领前20|谷歌学术指标2024

西风 发自 凹非寺量子位 | 公众号 QbitAI2024谷歌学术指标(Google Scholar Metrics)出炉,AI顶会掀起狂欢——CVPR成为第二大学术出版物,超越Science,仅次于Nature。除此之外,NeurIPS排名第7;ICLR第10、ICCV第13、ICML第17…前20名中,四分之一被AI会议占据。网友纷纷表示今年这榜单有点“crazy”:各领域学者教授也纷纷表示惊...

2024-07-11 11:48:15 127

转载 Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大

Pengfei Liu 投稿量子位 | 公众号 QbitAI评估大模型是否诚实的基准来了!上海交通大学生成式人工智能实验室(GAIR Lab)推出了一项开创性的评估基准——BeHonest,旨在全面评估大模型的诚实性,为安全透明的AI研发和应用提供重要参考。在人工智能(Artificial Intelligence, AI)飞速发展的今天,大语言模型(Large Language Models, ...

2024-07-11 11:48:15 140

转载 大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待

白交 发自 凹非寺量子位 | 公众号 QbitAI大模型权威测试,翻车了?!HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。此前MMLU原始版本早已经被各家大模型刷爆了,谁考都是高分,对前沿模型已经没有了区分度。号称更强大、更具挑战线性多任务语言基准MMLU-Pro,成了业界对大模型性能的重要参考。但结果没想到的是,现在有...

2024-07-11 11:48:15 36

原创 “云计算一哥”深夜放大招:几分钟,纯靠Prompt打造一个App!

金磊 假装发自 纽约量子位 | 公众号 QbitAI现在开发一个APP需要多久?“云计算一哥”亚马逊云科技,深夜给出了一个新标准——只需三步,几分钟,纯靠自然语言和鼠标“点点点”即可。话不多说,直接展示!第一步:说出你的想法我们首先可以直接用自然语言描述一下想要打造APP的需求,例如:为我的团队创建一个应用程序,可以通过一个表单提交项目审批。这个表单将接受详细信息,并允许用户上传相关文件。静候几秒...

2024-07-11 11:48:15 629

转载 ControlNet作者新项目爆火:仅一张图生成25秒绘画全过程!不到一天GitHub揽星600+...

西风 发自 凹非寺量子位 | 公众号 QbitAIControlNet作者张吕敏(Lvmin Zhang)又又又发新作了!输入任意一张图,分分钟就能“拆解”成一个25秒的图像绘制过程视频:从线稿到填色还有局部细节调整,全都有的那种:而且不止动漫风,各种风格都能驾驭:这个项目名为Paints-Undo,发布不到24小时,GitHub上已揽星600+:网友们针对它的讨论也经历了一轮又一轮,不少人纷纷表...

2024-07-10 12:13:36 49

转载 DeepMind新方法:训练时间减少13倍,算力降低90%

一水 发自 凹非寺量子位 | 公众号 QbitAI大幅节省算力资源,又又又有新解了!!DeepMind团队提出了一种新的数据筛选方法JEST——将AI训练时间减少13倍,并将算力需求降低90%。简单来说,JEST是一种用于联合选择最佳数据批次进行训练的方法。它就像一个智能的图书管理员,在一大堆书(数据)中挑选出最适合当前读者(模型)阅读的几本书(数据批次)。这样做可以让读者更快地学到知识(训练模型...

2024-07-10 12:13:36 39

转载 Claude编程支持一键共享,第一批网友已经开始晒作品了

克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.5上新的“工坊模式”(Artifacts)再次更新,写完的网页应用支持一键分享了!不用自建服务器,不用部署后台程序,点一下就能自动获得链接。而且被分享的应用还能一键导入自己的对话,分分钟魔改个新版本出来。除了官方通告外,Anthropic提示词工程师、开发者关系负责人Alex Albert也在推特上宣布了这一消息。Alex一边介...

2024-07-10 12:13:36 43

原创 国产大模型第一梯队玩家,为什么pick了CPU?

金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI一天,人间一年。现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般,虽然AIGC目前还处于起步阶段,但市场规模已初具雏形:预计到2030年将达4500亿人民币。AIGC应用正呈现多点开花之势,逐步从通用场景向行业纵深...

2024-07-10 12:13:36 1037

转载 谢赛宁团队突破高斯泼溅内存瓶颈,并行方案实现多显卡训练

克雷西 发自 凹非寺量子位 | 公众号 QbitAI高斯泼溅模型训练的内存瓶颈,终于被谢赛宁团队和NYU系统实验室打破!通过设计并行策略,团队推出了高斯泼溅模型的多卡训练方案,不必再受限于单张卡的内存了。用这种方法在4张卡上训练,可以加速3.5倍以上;如果增加到32卡,又能有额外6.8倍的加速。该团队提出的是一种名为Grendel的分布式训练系统,第一作者是清华姚班校友赵和旭。通过多卡训练,不仅速...

2024-07-09 19:46:21 42

原创 新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI新架构,再次向Transformer发起挑战!核心思想:将RNN中的隐藏状态换成可学习的模型。甚至在测试时都可以学习,所以该方法称为TTT(Test-Time Training)。共同一作UC伯克利的Karen Dalal表示:我相信这将从根本上改变语言模型。一个TTT层拥有比RNN表达能力更强的隐藏状态,可以直接取代Transformer中昂贵的...

2024-07-09 13:24:55 787

转载 无人车团队跨维进军好莱坞!推出电影级视觉AI特效,“新时代皮克斯”

一水 发自 凹非寺量子位 | 公众号 QbitAI好莱坞级视觉AI横空出世!一个demo已令网友疯狂~来,我们直接看视频:以上来自Odyssey,能够打造好莱坞级山脉、平原、植被、海洋、河流等故事镜头。其最大亮点在于,实现了对视觉叙事核心层的完全控制,使用户能够完全控制场景的每个生成元素和方面。这突破了现有视频AI最大的障碍——可控性。看完效果,有网友振臂高呼:新时代皮克斯!其他人更是第一时间争当...

2024-07-09 13:24:55 29

原创 第一批正在被AIGC重置的行业有话说

衡宇 发自 凹非寺量子位 | 公众号 QbitAIAIGC颠覆一切的时代,设计行业绝对是被影响最大的那一波。阿里一位从业近20年的老·设计师站出来说,AI 2.0时代来临后,很多不了解设计行业的人,上来就问他带的设计团队要减多少人。他说说实话,自己心里面有点不舒服。“大家为什么会这么理解?”老·设计师说,“其实AI跟设计之间的关系它是相辅相成的。”啊,不对啊,搞设计的朋友们不都觉得AI入侵,是对事...

2024-07-09 13:24:55 868

转载 Wolfram之父直播采访机器人,一小时30多个问题对答如流,还有网友在线提问

克雷西 发自 凹非寺量子位 | 公众号 QbitAI人类采访了机器人,足足一个多小时,还是对答如流的那种!干出此等花活的,正是Wolfram之父Stephen Wolfram——他接连提问30多个问题,话题内容也是非常广泛,从人类社会常识到机器人意识等等。采访完之后,Stephen对机器人的表现印象深刻,甚至打趣说正在重新适应人类。网友也表示,这是自己见过最weird的一次采访,还有人想到了《西部...

2024-07-09 13:24:55 31

转载 混元单日调用tokens达千亿后,腾讯大模型战略露出全貌

明敏 发自 凹非寺量子位 | 公众号 QbitAI大模型之争,到了不只是拼技术的时刻。最新的行业风向是:谁能大范围应用落地?谁能笑到最后?谁能真正产生价值?对大模型行业玩家的评判标准也不再只看技术。战略布局、落地进展、未来判断……成为了更被重视的维度。无论“杨植麟们”还是大厂高管,公开探讨大模型的频率越来越高,包括一直低调的腾讯。前脚,腾讯云与智慧产业事业群CEO汤道生万字采访释出,回应“关于腾讯...

2024-07-08 17:56:15 42

原创 院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出Memory3,比在参数中存储知识以及RAG成本都更低,同时保持比RAG更高的解码速度。在实验中,仅有2.4B参数的Memory3模型不仅打败了许多7B-13B的模型,在专业领域任务如医学上的表现也超过了传统的RAG方法,同时推理速度...

2024-07-08 17:56:15 697

转载 半小时教你手搓AI视频通话,还有懒人版代码已开源

克雷西 发自 凹非寺量子位 | 公众号 QbitAIGPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。于是,一位名叫Santiago(我们叫他三哥)的博主,用160行Python代码尝试了复刻。虽然技术路线和《Her》有所差别,但从直观效果来看,也算得上是给网友们带来了新的玩具。而且不仅是炫技,三哥是真的在试图把网友教会,用了半个多小时的时间讲解他的操作过程。不过,三哥的自我介绍...

2024-07-08 17:56:15 30

转载 支付宝医疗大模型亮相!中英文考试超GPT4,已落地江浙沪一线医院

白交 发自 WAIC量子位 | 公众号 QbitAI支付宝医疗大模型亮相!中英文医疗考试、基准测试达到甚至超过GPT-4水准。此外,其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中,位列A榜第一,B榜第二。模型在识别报告、药品、毛发等图像准确率中达90%以上。WAIC现场,支付宝还联合人民卫生出版社、北京大学医学部、浙江省卫生健康委等20家机构,联合发起AI医疗共建计划。支付宝医疗大...

2024-07-08 17:56:15 38

原创 苹果Vision Pro国行版首体验:百度网盘所有资源均可200寸大屏播放,一口气看个爽...

西风 发自 凹非寺量子位 | 公众号 QbitAI百度网盘实锤看片神器,重度爱好者也想不到,有一天它的打开方式会是酱婶儿的——只要是百度网盘里的视频资源,全部能实现在3D空间中200寸大屏播放。或者,你还可以置身360度全景视频之中,身临其境般沉浸式体验自然风光、风土人情,支持4K的那种:哦吼~这是哪门子的百度网盘?此等科技与狠活出自:百度网盘VR版。苹果Vision Pro刚国行发售,它也快速上...

2024-07-08 17:56:15 1093

转载 北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快

蔡泽凡 投稿量子位 | 公众号 QbitAI批评不仅能让人进步,也能让大模型的能力提升。OpenAI就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在CriticGPT放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在GSM8K上的准确率从86.6%提升到88.2%。在GSM8K数据集上,它可以让...

2024-07-07 21:07:26 42

原创 千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC

克雷西 发自 WAIC量子位 | 公众号 QbitAI“这可能是本届WAIC上欢呼声最多的一场发布”在刚刚闭幕的世界人工智能大会(WAIC)上,快手晒出了可灵发布一个月以来的成绩单:“超50万人申请,已开放给超30万用户使用,生成超700万条短视频。”作为全球首个用户可用的真实影像级视频生成大模型,可灵一经问世便引发了强烈反响,连外国网友都纷纷投来了羡慕的目光……甚至Stability AI的前C...

2024-07-07 21:07:26 764

转载 英伟达AMD差点合并,老黄提了个条件,结果黄了

西风 发自 凹非寺量子位 | 公众号 QbitAI在AI浪潮中赢麻了的英伟达,如今市值已达3.1万亿,远超另外两家芯片巨头AMD和英特尔。但一则内幕爆料引起热议:英伟达当年差点就被卖给了AMD。爆料人是一位AMD老员工,名为Hemant Mohapatra。他透露AMD曾几乎一度要买下英伟达,然鹅,当时老黄开出的条件是:他要成为新合并公司的CEO,否则英伟达,不卖。这才致使这场交易未能成功。Hem...

2024-07-07 21:07:26 33

原创 AI写公文,到底靠不靠谱?

金磊 明敏 发自 WAIC量子位 | 公众号 QbitAI什么?现在公务员处理政务,也都能用上模型了???没错,就在这次的世界人工智能大会(WAIC)上,金山办公便首次发布了一款别具一格的自研模型——金山政务办公模型1.0。话不多说,我们直接来看下效果。例如想要了解最近关于“新质生产力”的讲话,那么公务员现在只需一个“问”的动作即可:但问答这件事情对于任意模型来说都算是基本功了,那么像写公文这样难...

2024-07-06 18:47:24 872

转载 扩散模型也能推荐短视频!港大腾讯提出新范式DiffMM

DiffMM团队 投稿量子位 | 公众号 QbitAI想象一下你在刷短视频,系统想要推荐你可能会喜欢的内容。但是,如果系统只知道你过去看过什么,而不了解你喜欢视频的哪些方面(比如是画面、文字描述还是背景音乐),那么推荐可能就不会那么精准。对此,来自港大和腾讯的研究人员推出了全新多模态推荐系统范式——DiffMM。简单来说,DiffMM创建了一个包含用户和视频信息的图,这个图会考虑视频的各种元素。然...

2024-07-06 18:47:24 37

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除