AI大模型日报#09-05:1000个智能体创建首个「AI文明」、三星高管剧透GPT-5

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:今日AI大模型领域的资讯涌现出多个亮点。首先,北大校友在虚拟世界中创建了首个由1000多个智能体构成的“AI文明”,展现了智能体的大规模协作能力。这些智能体不仅形成了复杂的经济体系,还模拟出类似人类的社会活动,为AI与人类文明的融合探索了新路径。同时,清华大学的研究团队利用大语言模型构建了EconAgent,革新了计算经济学研究,其模拟的宏观经济现象表现优异,验证了经济规律。 然而,在AI大模型领域蓬勃发展的同时,挑战与问题也随之而来。英伟达的市值暴跌反映出市场对AI前景的谨慎态度,以及对反垄断调查的担忧。此外,OpenAI的崛起被归因于兴趣驱动的探索,而非单一的目标导向,这为AI的发展提供了新的思考角度。 在技术与应用方面,智源研究院推出了全球首个包含文生视频的模型对战评测服务,旨在优化大模型的性能评估。同时,OLMoE作为首个100%开源的MoE大模型,展现了成本效益与前沿性能的结合,有望推动混合专家模型领域的进步。 最后,行业内的投资动态也值得关注。OpenAI前首席科学家Ilya Sutskever的新公司SSI获得巨额融资,展现了市场对安全超级智能的高度关注。同时,三星高管剧透的GPT-5模型引发外界期待,其潜在的巨大参数规模和强大训练配置预示着AI大模型领域的新一轮竞争即将来临。

标题: 1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」
摘要:  1. 首个智能体文明在虚拟世界“我的世界”中诞生,由1000多个智能体协作构建,拥有经济、文化、宗教和政府体系。 2. 这些智能体是完全自主的个体,能够利用工具和游戏实现目标,形成了交易市场和经济体系,以宝石作为货币。 3. 智能体开展了类似人类世界的活动,能够24小时无间断参与,且每天都有所不同,展现了大规模合作的能力。 4. 项目代号“Sid”,由北大校友、MIT教授Robert Yang发起,Altera团队实现,通过GPT-4加持,智能体合作取得了超出以往5倍的效果。 5. 智能体被赋予不同角色,展现类似人类的情感和行为,如Olivia放弃探险梦想,民主投票模拟政治交互等。 6. Altera平台提供试玩智能体游戏世界,其中Elon、T-2000、Katniss等智能体受欢迎,还有教学视频指导玩家。 7. 团队致力于构建AI大脑,连接前额叶皮层与多个模块,打造富有人性的智能体,探索将AI文明与人类文明整合。
网址: 1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」|ai文明|mit|olivia|智能体|计算机_手机网易网
 
标题: 清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式
摘要: 清华大学的研究团队利用大语言模型(LLM)构建了一种名为EconAgent的智能体,用于模拟宏观经济活动中个体的工作与消费行为。该研究论文获得了自然语言处理顶级会议ACL 2024的杰出论文奖。通过赋予智能体差异化的画像和对真实经济环境的感知能力,EconAgent能够在模拟中展现出更稳定、真实的宏观经济现象。研究结果显示,基于EconAgent的模拟在宏观经济指标和经济规律方面表现优异,成功复现了诸如通胀率、失业率等重要经济指标,并验证了Phillips Curve等经济规律。此外,研究还探究了重要事件(如COVID-19)对EconAgent行为的影响,显示出该方法能够定性模拟宏观经济受到的冲击。
网址: 清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式|宏观经济|智能体|清华|经济学|论文_手机网易网
 
标题: 英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录
摘要: 英伟达市值一夜蒸发2790亿美元,创下美股史上单日最大跌幅,主要原因是投资者对AI前景的谨慎态度和美国司法部对英伟达的反垄断调查升级。此次暴跌甚至拖累了整个芯片股的表现。同时,英伟达面临着反垄断调查的进一步升级,被怀疑让客户更难转向其他供应商,对不完全使用其AI芯片的买家置于不利地位。尽管英伟达对此做出回应,但市场对其未来的担忧仍在加剧。
网址: 英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录|amd|nvidia|平均售价|英伟达|英特尔|高通|黄仁勋_手机网易网
 
标题: 跟两位亲历者聊聊 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松
 


摘要: 两位人工智能研究者认为,过于高远的目标需要开放性探索。他们合著的《为什么伟大不能被计划》提出这一观点。OpenAI的成功被看作目标导向,但实则有大量开放性探索。例如,ChatGPT是边缘项目,却意外成功。二人认为,仅靠Scaling Law不够实现AGI,开放性探索对创新至关重要。他们离开OpenAI后,继续研究开放性命题,希望从哲学角度看待AI。尽管OpenAI有目标导向的叙述,但其内部推动工作并非完全如此,这也验证了书中的观点。
网址: 跟两位亲历者聊聊 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松 | 极客公园
 
标题: 智源研究院推出全球首个包含文生视频的模型对战评测服务
 


摘要: 智源研究院于2024年9月4日推出了全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。该服务覆盖约40款国内外大模型,支持语言问答、多模态图文理解、文生图、文生视频等四大任务的自定义评测。除网页端外,还提供了国内首个移动端访问入口。评测采取匿名机制,并首次引入主观倾向阶梯评分体系,以更精准揭示模型性能差异。该服务旨在通过用户与模型的多轮交流,衡量模型输出与人类期望的一致性,并持续迭代和优化智源在模型对战评测领域的技术布局。未来,智源计划开源模型对战评测的全链路数据,以推动大模型评测生态的发展。
网址: 智源研究院推出全球首个包含文生视频的模型对战评测服务
 
标题: 第一个100%开源的MoE大模型,7B的参数,1B的推理成本
 


摘要: 科技记者要点提炼: 研究者推出了OLMoE,这是一款完全开源的混合专家语言模型,具有成本效益并在性能上达到前沿水平。该模型采用稀疏激活技术,在预训练阶段使用了5.1万亿个token,拥有69亿参数,但每个输入仅激活其中的13亿参数,从而实现了与大型密集模型相似的推理成本。实验表明,OLMoE训练速度更快,性能优于同类开源模型,并且在多项基准测试中表现出竞争力。此外,研究还强调了使用细粒度路由和粒度专家以及无丢弃token的路由方法对于提升MoE性能的重要性。OLMoE的推出有望促进混合专家模型领域的进一步研究和理解,其训练代码、中间检查点、训练日志和训练数据均已开源。
网址: 第一个100%开源的MoE大模型,7B的参数,1B的推理成本 | 机器之心
 
标题: 刚刚,Ilya新公司SSI融资10亿、估值50亿美元,网友:它甚至还没有产品
 


摘要: OpenAI前首席科学家Ilya Sutskever的新公司SSI(安全超级智能)已募集10亿美元融资,投资者包括顶级风险投资公司。SSI专注于构建安全超级智能,估值已达50亿美元。公司计划利用融资增强算力、聘请顶尖人才,并注重招聘适应其文化的人才。SSI旨在通过小型高度信任团队实现安全超级智能,同时确保安全性与能力并重。此次巨额融资引发外界震撼,人们期待SSI能有效利用资金并达成目标。
网址: 刚刚,Ilya新公司SSI融资10亿、估值50亿美元,网友:它甚至还没有产品 | 机器之心
 
标题: 三星高管剧透GPT-5:3-5万亿参数,7000块B100训练
 


摘要: 三星高管剧透GPT-5模型将拥有3-5万亿参数,由7000块B100训练而成,引发网友热议。同时,OpenAI日本办事处负责人和微软CTO也暗示了新模型的推出。此外,OpenAI域名更新和新闻账号的开设进一步加剧了外界对新模型的期待。有网友分析认为,新模型可能采用新架构,实现能力指数级增长,且LLM已趋于稳定。然而,也有网友希望此次不是炒作,而是真正的新模型推出。
网址: 三星高管剧透GPT-5:3-5万亿参数,7000块B100训练 | 量子位


 

点击体验、订阅《AI大模型每日早报》 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

常政

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值