AI大模型日报#09-05：1000个智能体创建首个「AI文明」、三星高管剧透GPT-5

本文链接：https://blog.csdn.net/lionkingcz/article/details/141937001

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！

目前采用“文心一言”（ERNIE-4.0-8K-latest）、“智谱AI”（glm-4-0520）生成了今日要点以及每条资讯的摘要。欢迎阅读！

《AI大模型日报》今日要点：今日AI大模型领域的资讯涌现出多个亮点。首先，北大校友在虚拟世界中创建了首个由1000多个智能体构成的“AI文明”，展现了智能体的大规模协作能力。这些智能体不仅形成了复杂的经济体系，还模拟出类似人类的社会活动，为AI与人类文明的融合探索了新路径。同时，清华大学的研究团队利用大语言模型构建了EconAgent，革新了计算经济学研究，其模拟的宏观经济现象表现优异，验证了经济规律。然而，在AI大模型领域蓬勃发展的同时，挑战与问题也随之而来。英伟达的市值暴跌反映出市场对AI前景的谨慎态度，以及对反垄断调查的担忧。此外，OpenAI的崛起被归因于兴趣驱动的探索，而非单一的目标导向，这为AI的发展提供了新的思考角度。在技术与应用方面，智源研究院推出了全球首个包含文生视频的模型对战评测服务，旨在优化大模型的性能评估。同时，OLMoE作为首个100%开源的MoE大模型，展现了成本效益与前沿性能的结合，有望推动混合专家模型领域的进步。最后，行业内的投资动态也值得关注。OpenAI前首席科学家Ilya Sutskever的新公司SSI获得巨额融资，展现了市场对安全超级智能的高度关注。同时，三星高管剧透的GPT-5模型引发外界期待，其潜在的巨大参数规模和强大训练配置预示着AI大模型领域的新一轮竞争即将来临。

标题: 1000个智能体创建首个「AI文明」！北大校友放弃MIT教职打造「西部世界」
摘要: 1. 首个智能体文明在虚拟世界“我的世界”中诞生，由1000多个智能体协作构建，拥有经济、文化、宗教和政府体系。 2. 这些智能体是完全自主的个体，能够利用工具和游戏实现目标，形成了交易市场和经济体系，以宝石作为货币。 3. 智能体开展了类似人类世界的活动，能够24小时无间断参与，且每天都有所不同，展现了大规模合作的能力。 4. 项目代号“Sid”，由北大校友、MIT教授Robert Yang发起，Altera团队实现，通过GPT-4加持，智能体合作取得了超出以往5倍的效果。 5. 智能体被赋予不同角色，展现类似人类的情感和行为，如Olivia放弃探险梦想，民主投票模拟政治交互等。 6. Altera平台提供试玩智能体游戏世界，其中Elon、T-2000、Katniss等智能体受欢迎，还有教学视频指导玩家。 7. 团队致力于构建AI大脑，连接前额叶皮层与多个模块，打造富有人性的智能体，探索将AI文明与人类文明整合。
网址: 1000个智能体创建首个「AI文明」！北大校友放弃MIT教职打造「西部世界」|ai文明|mit|olivia|智能体|计算机_手机网易网

标题: 清华EconAgent获ACL 2024杰出论文：大模型智能体革新计算经济学研究范式
摘要: 清华大学的研究团队利用大语言模型（LLM）构建了一种名为EconAgent的智能体，用于模拟宏观经济活动中个体的工作与消费行为。该研究论文获得了自然语言处理顶级会议ACL 2024的杰出论文奖。通过赋予智能体差异化的画像和对真实经济环境的感知能力，EconAgent能够在模拟中展现出更稳定、真实的宏观经济现象。研究结果显示，基于EconAgent的模拟在宏观经济指标和经济规律方面表现优异，成功复现了诸如通胀率、失业率等重要经济指标，并验证了Phillips Curve等经济规律。此外，研究还探究了重要事件（如COVID-19）对EconAgent行为的影响，显示出该方法能够定性模拟宏观经济受到的冲击。
网址: 清华EconAgent获ACL 2024杰出论文：大模型智能体革新计算经济学研究范式|宏观经济|智能体|清华|经济学|论文_手机网易网

标题: 英伟达市值暴跌2万亿！一夜蒸发3个英特尔，创美国历史纪录
摘要: 英伟达市值一夜蒸发2790亿美元，创下美股史上单日最大跌幅，主要原因是投资者对AI前景的谨慎态度和美国司法部对英伟达的反垄断调查升级。此次暴跌甚至拖累了整个芯片股的表现。同时，英伟达面临着反垄断调查的进一步升级，被怀疑让客户更难转向其他供应商，对不完全使用其AI芯片的买家置于不利地位。尽管英伟达对此做出回应，但市场对其未来的担忧仍在加剧。
网址: 英伟达市值暴跌2万亿！一夜蒸发3个英特尔，创美国历史纪录|amd|nvidia|平均售价|英伟达|英特尔|高通|黄仁勋_手机网易网

标题: 跟两位亲历者聊聊 OpenAI 崛起的关键：兴趣驱动的探索，而非目标导向的马拉松

摘要: 两位人工智能研究者认为，过于高远的目标需要开放性探索。他们合著的《为什么伟大不能被计划》提出这一观点。OpenAI的成功被看作目标导向，但实则有大量开放性探索。例如，ChatGPT是边缘项目，却意外成功。二人认为，仅靠Scaling Law不够实现AGI，开放性探索对创新至关重要。他们离开OpenAI后，继续研究开放性命题，希望从哲学角度看待AI。尽管OpenAI有目标导向的叙述，但其内部推动工作并非完全如此，这也验证了书中的观点。
网址: 跟两位亲历者聊聊 OpenAI 崛起的关键：兴趣驱动的探索，而非目标导向的马拉松 | 极客公园

标题: 智源研究院推出全球首个包含文生视频的模型对战评测服务

摘要: 智源研究院于2024年9月4日推出了全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。该服务覆盖约40款国内外大模型，支持语言问答、多模态图文理解、文生图、文生视频等四大任务的自定义评测。除网页端外，还提供了国内首个移动端访问入口。评测采取匿名机制，并首次引入主观倾向阶梯评分体系，以更精准揭示模型性能差异。该服务旨在通过用户与模型的多轮交流，衡量模型输出与人类期望的一致性，并持续迭代和优化智源在模型对战评测领域的技术布局。未来，智源计划开源模型对战评测的全链路数据，以推动大模型评测生态的发展。
网址: 智源研究院推出全球首个包含文生视频的模型对战评测服务

标题: 第一个100%开源的MoE大模型，7B的参数，1B的推理成本

摘要: 科技记者要点提炼：研究者推出了OLMoE，这是一款完全开源的混合专家语言模型，具有成本效益并在性能上达到前沿水平。该模型采用稀疏激活技术，在预训练阶段使用了5.1万亿个token，拥有69亿参数，但每个输入仅激活其中的13亿参数，从而实现了与大型密集模型相似的推理成本。实验表明，OLMoE训练速度更快，性能优于同类开源模型，并且在多项基准测试中表现出竞争力。此外，研究还强调了使用细粒度路由和粒度专家以及无丢弃token的路由方法对于提升MoE性能的重要性。OLMoE的推出有望促进混合专家模型领域的进一步研究和理解，其训练代码、中间检查点、训练日志和训练数据均已开源。
网址: 第一个100%开源的MoE大模型，7B的参数，1B的推理成本 | 机器之心

标题: 刚刚，Ilya新公司SSI融资10亿、估值50亿美元，网友：它甚至还没有产品

摘要: OpenAI前首席科学家Ilya Sutskever的新公司SSI（安全超级智能）已募集10亿美元融资，投资者包括顶级风险投资公司。SSI专注于构建安全超级智能，估值已达50亿美元。公司计划利用融资增强算力、聘请顶尖人才，并注重招聘适应其文化的人才。SSI旨在通过小型高度信任团队实现安全超级智能，同时确保安全性与能力并重。此次巨额融资引发外界震撼，人们期待SSI能有效利用资金并达成目标。
网址: 刚刚，Ilya新公司SSI融资10亿、估值50亿美元，网友：它甚至还没有产品 | 机器之心

标题: 三星高管剧透GPT-5：3-5万亿参数，7000块B100训练

摘要: 三星高管剧透GPT-5模型将拥有3-5万亿参数，由7000块B100训练而成，引发网友热议。同时，OpenAI日本办事处负责人和微软CTO也暗示了新模型的推出。此外，OpenAI域名更新和新闻账号的开设进一步加剧了外界对新模型的期待。有网友分析认为，新模型可能采用新架构，实现能力指数级增长，且LLM已趋于稳定。然而，也有网友希望此次不是炒作，而是真正的新模型推出。
网址: 三星高管剧透GPT-5：3-5万亿参数，7000块B100训练 | 量子位