超级Prompt、量子纠缠突然消失、文生图模型恐不可用、GPT Next 计划 | AGI 视界周刊第 7 期

AGI 视界周刊由 AGI 掘金知识库共建者战场小包维护,每周一更新,包含热点聚焦、应用破局、学术前沿、社区热议、智见交锋、跨界 AI、企业动态和争议 AI 八大板块,后续板块划分和内容撰写在周刊迭代过程中持续优化,欢迎大家提出。

欢迎大家来到《AGI视界周刊第七期》(09/02~09/08)。

✨ 热点聚焦

噩耗!SD3、FLUX.1等开源文生图模型,可能将无法使用

美国加州法案AB-3211针对文生图模型提出新规定,要求模型必须嵌入难以移除的元数据和水印,否则违法。该法案若通过,将对开源模型如SD3、FLUX.1造成重大影响,增加技术难度和成本,可能抑制创新。法案得到科技巨头支持,但对小型开发者和学术机构不利。

超级Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了

GitHub上的一个名为Super Prompt的项目在短时间内获得了大量关注。这个项目由Twitter用户@BLUECOW009创建,声称能通过特定的提示词(prompt)激发大型语言模型(LLM)的科学思维。尽管项目中的提示词大部分是乱码,但作者声称其设计目的是帮助研究复杂科学问题。项目被广泛讨论,有用户报告了有趣的结果,但也有一些用户未能成功。目前,Super Prompt的有效性尚未得到科学验证,作者计划未来详细解释其原理。

用数学方法证明量子纠缠会突然消失!MIT 计算机科学家“无心插柳”提供关键论证

MIT 计算机科学家团队通过数学方法发现,在一定温度值以上,量子纠缠会完全消失,导致基于纠缠的量子计算和通信协议失效。这一发现意味着量子计算机在高温下可能失去其计算优势。此前,学界虽观察到量子纠缠随温度升高而减弱,但缺乏直接证据。该团队的研究提供了全面严谨的数学证明,揭示了量子纠缠“突然死亡”的现象,并指出这一现象与系统中原子间的相互作用有关,而非原子总数。研究结果为量子物理学和量子计算机理论提供了新的视角和理解。

GPT-4o mini 排名雪崩,大模型竞技场规则更新,奥特曼刷分小技巧无效了

大模型竞技场更新规则,导致 GPT-4o mini 排名急剧下降。新规则对回答长度和风格进行降权,以更真实反映模型解决问题的能力。奥特曼的 GPT-4o mini 和马斯克的 Grok-2 系列受影响较大,而 Claude 系列和 Llama-3.1-405b 大模型分数上升。Lmsys 通过公开数据和新算法控制风格影响,使榜单更符合实际性能。调整后的榜单更贴近用户主观印象,促进了 AI 领域的整体进步。

米哈游蔡浩宇发布爆款言论,新 AI 公司曝光:挖 Llama 3 科学家坐镇大模型

米哈游创始人蔡浩宇认为 AIGC 将彻底改变游戏开发,未来游戏创造将只属于顶尖团队和业余爱好者。他参与创建的 AI 公司 Anuttacon 汇集了多位行业大牛,包括计算机图形学专家童欣和大模型研究负责人吴箫剑。Anuttacon 旨在利用 AI 技术为游戏玩家创造前所未有的体验,突破互动娱乐的界限。蔡浩宇的言论和 Anuttacon 的成立预示着 AI 技术在游戏行业的深远影响。

OpenAI 今年启动 GPT Next 计划:AI 性能百倍级跃升,Orion 有望接棒 GPT-4

OpenAI Japan 首席执行官长崎忠雄(Tadao Nagasaki)表示,虽然 GPT-3 和 GPT-4 的性能比较接近,但 GPT Next 预计会有更大的飞跃,性能将提高 100 倍。长崎忠雄于 2024 年 4 月成为 OpenAI Japan 的掌舵者,他在会上强调相比较传统软件,AI 技术正以指数级速度发展。penAI 目前正在开发两个新的人工智能系统:草莓“Strawberry” AI 模型主要提高数学和编程等领域能力,而“Orion”可能成为 GPT-4 的真正继任者,从而成为“GPT Next”。

📲 应用破局

阿里通义上新 PPT 创作!PC 端“效率”功能三合一,听读写一站搞定

阿里通义新推出的 PC 端“效率”功能集实时记录、阅读助手和 PPT 创作于一体,旨在提升工作效率。PPT 创作支持一句话主题生成和文件上传,提供丰富模板和智能编排,实现快速制作。实时记录功能支持多语言转文字和智能总结,而阅读助手则能速读多种格式文档并提供全文翻译。这些功能基于通义千问大模型 2.5,优化了理解、逻辑推理和指令遵循能力,支持长文档和多模态输入,为用户提供一站式的信息整理、阅读和创作解决方案。

穿着西装的「人」却专做家务?OpenAI 家庭机器人 NEO 登场,动作丝滑逼近人类!

1X Technologies 公司推出了最新的家用机器人 NEO,该机器人外形自然拟人,动作流畅,能够执行多种家务任务。NEO 身高 1.67 米,体重 30 公斤,拥有 20 个自由度的手部,能举起 70 公斤的重量。它采用轻量化设计,动作自然,能与人类进行交互,如打招呼和拥抱。NEO 的机载电机产生的力量接近人体肌肉力密度的 80%,且运行时非常安静。目前,NEO 处于 Beta 测试阶段,公司计划在挪威工厂大规模生产。NEO 的设计注重安全性,能够在家庭环境中安全操作,预计将在未来几年内成为家务机器人的主流。

世界首个 1 亿 token 神级上下文模型诞生,前 OpenAI 大佬加盟获 4.65 亿融资!

Magic 公司开发的 LTM-2-mini AI 模型,上下文窗口达到 1 亿 token,相当于 1000 万行代码,远超现有技术。该模型采用序列维度算法,计算效率比 Llama 3.1 405B 的注意力机制高出约 1000 倍,大幅减少计算和内存需求。团队创新 HashHop 评估体系,提高上下文长度和可靠性。Magic 已获得包括 Eric Schmidt 和红杉资本在内的 4.65 亿美元融资,致力于实现编码和研究的全自动化,推动 AGI 发展。

讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

科大讯飞推出星火版「Her」AI 助手,支持极速响应和自由打断,具备高情绪价值和逼真的人设表现。该技术通过端到端建模,实现语音到语音的直接转换,减少响应延迟,保留语音中的情感和环境信息。AI 助手能够识别和响应数十种情绪,支持多种方言和风格,提供丰富的交互体验。讯飞的这一创新预示着语音交互技术的突破,将推动智能语音市场的发展,为用户带来更自然、更智能的交流方式。

零一万物开源 Yi-Coder 系列编程助手模型,支持 52 种编程语言

零一万物公司于2024年9月5日开源了Yi-Coder系列编程助手模型,该系列模型专为编码任务设计,提供1.5B和9B两种参数版本。Yi-Coder-9B在多个编程任务中表现优异,支持52种编程语言,具备128K长序列建模能力,并在代码生成、编辑和补全方面取得显著成绩。模型的开源旨在鼓励开发者探索大语言模型在编程领域的应用。

三星高管剧透GPT-5高达5万亿参数,OpenAI匿名模型上线

三星高管Jung Bae Lee在CEO Summit上透露了GPT-5模型的参数规模,预计在3-5万亿之间,由7000块B100芯片训练而成。同时,OpenAI日本办事处负责人Tadao Nagasaki也暗示将推出比GPT-4强大100倍的“GPT Next”。此外,微软CTO Kevin Scott的演讲中也提到了相关图像,而一个匿名聊天机器人在Lmsys大模型竞技场上线。OpenAI通过更新域名和开设新闻账号暗示将有重要消息发布,引发网友对GPT-5即将到来的热议

OpenAI首颗芯片曝光:台积电1.6nm,为Sora定制

OpenAI的首款自研芯片采用台积电1.6纳米先进工艺,专为AI视频生成工具Sora定制。此举表明OpenAI在减少对外部AI芯片依赖上迈出重要一步。芯片将采用台积电最新A16工艺,提升性能并降低功耗。同时,OpenAI与苹果的合作可能使Sora集成至Apple Intelligence。台积电A16工艺的先进性和与英特尔18A节点的竞争也成为焦点。

OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音

科技媒体 testingcatalog 报道称通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加 8 种新语音,这些新语音能让朗读声音更自然和富有表现力,且能更自然地表达动物叫声等非语言声音,在朗读加粗或斜体文字时还能传达或强调特定情绪。但这些仍是 TTS 语音,可能与目前处于 alpha 阶段的高级语音模式无关。

🎏 智见交锋

Anthropic 创始人 Dario Amodei:关于护城河与风险,AI 大多数情况很难直接替代人

Anthropic 创始人 Dario Amodei 与科技投资人 Erik Torenberg 对话,讨论 AI 安全性、全球竞争和行业监管。Amodei 认为 AI 系统可控性高,强调监管应避免过度,支持威慑机制管理 AI 风险。他指出 AI 可能加剧经济不平等,但通过政策和监管可实现技术红利普惠。Amodei 还讨论了 AI 公司护城河问题,提出在 AI 模型规模扩大的情况下,可能形成寡头垄断市场。他预测 AI 将改变工作方式,但人类与 AI 的比较优势将持续存在。最后,他强调了 AI 技术在国家安全中的重要性,以及中美在 AI 领域的竞争态势。

端侧AI的终极形态

作为争夺下一代流量入口的关键机遇,端侧AI(运行在手机等设备端的生成式AI模型)已然成为各大厂商必争之地。虽然,站在当下的时间点,除了少数工程样机之外,我们仍难以在终端设备上获得理想的AI体验,这主要是因为大模型在终端设备落地时,仍然面临诸多挑战。比如,短期内,从突破难度来排序,电池续航和散热问题>显存带宽>GPU算力和显存容量,成为一系列亟待解决的难点。尽管如此,终端生态多方的信心并没有受到影响,大家正在使尽浑身解数共同促进端侧AI的实现。

端测AI芯片,群雄争霸

数据流处理器专为神经网络推理和训练计算设计。例如,ADI的MAX78000是一种低功耗混合信号CNN加速器,集成了多个并行处理器,支持多种权重精度。苹果的A16和M2处理器则在性能和功耗之间取得了平衡,适用于高性能边缘设备。Blaze的Pathfinder P1600 El Cano Al处理器整合了16个图形流处理器,峰值性能为16TOPS,适合高性能计算任务。神经形态处理器模仿生物神经元的工作方式,以极低的功耗实现Al计算。例如,BrainChip的Akida系列使用脉冲神经网络(SNN)实现高效推理,功耗仅为2W。IBM的TrueNorth处理器则以65mW的功耗实现了 46GSOPS/W的性能,适合实时跟踪和检测任务。

亲历者揭秘 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松

OpenAI 看似是目标导向的成功,实则内部有很多开放性探索,如 ChatGPT 就是意料之外的项目。目前人工智能界目标收敛明确,如追上 OpenAI 及尽快实现 AGI,但作者认为离 AGI 还有距离,Scaling Law 可能会遇到瓶颈,行业激烈竞争可能让研究走进 “死胡同”,开放性探索非常重要。

⏳ 社区热议

Claude也变懒了!网友:学会给自己放假了

近期Reddit上用户反映AI大模型Claude表现下降,出现停顿和输出变短。首席信息安全官Jason Clinton回应称模型表现应无变化。独立AI研究员@nearcyan提出,Claude可能模拟了欧洲的暑假模式。此外,GPT-4也曾出现类似情况,但未找到具体原因。目前,关于大型模型性能下降的原因仍需学术界的进一步研究。

阿里大模型被Github一度404,负责人紧急回应:没跑路,平台故障误伤

近日,阿里Qwen的GitHub页面出现404错误,引发开发者关注。负责人林俊旸回应称,问题为平台故障,并非团队问题。此次事件意外提高了Qwen团队的知名度。阿里Qwen2-VL多模态模型在视觉理解基准上取得新SOTA,支持多种功能,如图像和视频理解、多语言支持等。尽管在医生处方测试中未能成功,但整体表现受到好评。Qwen团队计划发布更大的72B模型,并利用阿里魔搭开放平台进行宣传。

🎯 争议 AI

晋江文学城痛批“部分博主偷取多部知名小说喂 AI”:无耻嚣张的侵权行为

晋江文学城官方微博发文,强烈谴责部分博主使用平台小说训练 AI 生成文字内容的行为。这些博主在小红书平台宣传 AI 制作文字的方法,分解作品内容生成 AI 文字,严重侵犯了作者权益。晋江文学城法务已向小红书发函维权,要求删除侵权内容,并将持续关注和对抗此类侵权行为。同时,晋江文学城也表达了对 AI 拼凑文字内容行为的坚决抵制态度,强调将维护作者权益,反对窃取智慧成果的行为。

🛶 跨界 AI

8 秒生成犯罪现场报告,美警使用 AI 工具写文书,竟比人脑回忆还准

美国警察采用 AI 工具 Draft One 辅助撰写犯罪报告,显著提升文书工作效率。该工具由 GPT-4 支持,能迅速将执法记录仪音频转录成报告,减少 82%的撰写时间。尽管受到警务人员欢迎,但存在准确性和偏见问题。AI 报告可能包含错误信息,且种族偏见问题引起关注。Axon 公司通过测试确保不同种族间报告无显著差异,并建议仅用于轻罪报告。技术仍在测试阶段,以确保其在警务工作中的可靠性。

🎮 企业动态

OpenAI,等待下一任“金主”

OpenAI计划进行新一轮数十亿美元的融资,由Thrive Capital领投10亿美元,估值超过1000亿美元。自2015年成立以来,OpenAI共经历7轮融资,累计融资超过200亿美元,其中微软投资120亿美元。随着AI技术的发展,OpenAI用户数突破2亿,公司从非营利组织转变为营利实体。微软不仅提供资金支持,还提供云服务器资源。目前,OpenAI正在开发GPT-5,并考虑IPO,以解决资金需求。

英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录

英伟达市值在一夜之间蒸发2790亿美元,创下美国公司单日最大跌幅纪录。这一跌幅不仅反映了投资者对AI市场的谨慎态度,也与美国司法部对英伟达的反垄断调查升级有关。英伟达被怀疑限制客户转向其他供应商,并在AI芯片销售上对买家施加不利条件。此外,英伟达的暴跌还对整个芯片股市场产生了负面影响,导致包括英特尔、AMD在内的多家公司股价下跌。

千亿AI妖股连年亏损近55亿,AI的赚钱能力为何还不及“黑神话: 悟空”游戏?

寒武纪科技作为AI算力龙头,尽管市值高达千亿,却连续第八年亏损,累计亏损近55亿元。与此同时,国产游戏“黑神话:悟空”短期内获得巨额利润,引发对AI产业盈利能力的质疑。AI企业面临激烈的市场竞争、难以大规模商业化、研发投入高昂等问题。尽管AI技术潜力巨大,但目前其经济效益有限,需要更多时间和耐心来实现其价值。

📑 学术前沿

牛津大学:模型训练就像养孩子!别教太多,难度适中是关键

牛津大学Alex Rutherford团队的研究提出了一种新的强化学习(RL)智能体训练方法,即"Sampling for Learnability (SFL)"算法。该算法通过选择AI智能体时而能解决、时而失败的任务来训练,类似于养育孩子时难度适中的挑战,旨在促进学习进步。研究显示,这种方法在多个领域测试中效果优于现有顶尖算法。然而,也存在对算法在高随机性场景下可能遇到的瓶颈的担忧。

贾扬清点赞!Lightning AI推出通用模型引擎LitServe:什么都好,除了慢

Lightning AI推出了一款名为LitServe的通用模型引擎,旨在支持多模态和各种模型,但被指出速度较慢。开发者Kuldeep Singh Sidhu认为其灵活性和对多模态模型的支持是优势,但需要提高速度。官方解释称LitServe为完全控制内部结构而设计,速度慢是设计选择的结果,同时推出了LitGPT以追求速度。LitServe基于FastAPI构建,具有高度灵活性和多模态支持,但速度是其短板。

李飞飞团队提出ReKep,让机器人具备空间智能,还能整合GPT-4o

李飞飞团队提出了关系关键点约束(ReKep)框架,旨在提升机器人的空间智能,使其能够与环境进行复杂交互。ReKep通过将任务分解为关键点序列,并结合GPT-4o等多模态大模型,实现对机器人操作任务的约束优化。实验结果显示,该系统在非结构化环境中表现良好,能够处理核心难题,且具备一定的泛化能力。

MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

香港大学研究团队提出AnyGraph,一种新型图基础模型,旨在解决图数据的结构和特征异质性问题。该模型采用混合专家模型(MoE)架构,通过特征统一方法处理异质性,并通过轻量化路由机制提升快速适应能力。AnyGraph在泛化能力上符合Scaling Law,展示了图大模型的潜力。

迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试

上海交通大学联合上海AI Lab和中国移动等机构的研究团队,在arXiv预印平台发布了一篇关于医疗大语言模型(LLM)的全面研究。文章《Towards Evaluating and Building Versatile Large Language Models for Medicine》从数据、评测、模型等多个角度分析了临床医学大语言模型的应用。研究团队发布了大规模指令微调数据集MedS-Ins、开源模型MMedIns-Llama 3,并提出了全面基准测试MedS-Bench,以推动医学语言模型的发展和临床实践中的应用。

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北京大学李戈教授团队提出了一种新的单元测试生成方法HITS,通过程序分片技术显著提升了大模型在复杂函数测试样例生成中的覆盖率。该方法利用大模型的自然语言处理能力,将复杂函数拆分为简单片段,并为每个片段生成测试样例,有效降低了分析难度并提高了测试效率。HITS在ASE 2024顶会上被接受,并在实验中显示出优于现有方法的性能。

3天把Llama训成Mamba,性能不降,推理更快!

康奈尔和普林斯顿的研究人员成功将大型Transformer模型Llama提炼成Mamba模型,并设计了新的推测解码算法,显著提高了模型的推理速度。研究团队采用了渐进式蒸馏、监督微调和定向偏好优化等方法,将Zephyr-7B、Llama-3 8B转化为线性RNN模型,性能与从头开始训练的Mamba模型相当,且训练过程仅使用了20B的token。

LeCun转帖,AI精确计算宇宙「设置」,登Nature子刊

Meta首席人工智能科学家Yann LeCun在X平台上转发了纽约大学物理系教授Shirley Ho的帖子,展示了SimBIG 团队的一项新研究。由Changhoon Hahn领导的团队通过AI模拟宇宙,模拟了20,000个虚拟宇宙并产生了新的见解。这项研究利用AI根据光谱望远镜(如Sdssurveys) 的数据,训练AI从观测到的宇宙统计中推断出关键的宇宙学参数。

后语

我是 战场小包 ,一个喜欢 AI 和前端的小编程。

如果喜欢小包,可以在 战场小包的csdn 关注我,同样也可以关注我的小小公众号——小包学前端,公众号会持续地更新 AI 和前端的知识。

一路加油,冲向未来!!!

  • 13
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值