AI大模型日报#0821：谷歌想创造第二个Transformer、阿里发布最强数学大模型

本文链接：https://blog.csdn.net/lionkingcz/article/details/141374913

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！

目前采用“文心一言”（ERNIE-4.0-8K-latest）、“智谱AI”（glm-4-0520）生成了今日要点以及每条资讯的摘要。欢迎阅读！

《AI大模型日报》今日要点：谷歌新成立的Google DeepMind部门推出的Gemini模型在大模型排行中表现优异，公司计划发明新AI架构并提升模型能力。浙江大学李玺团队提出的ScanFormer模型通过迭代感知框架提升视觉语言任务效率。阿里发布的Qwen2-Math成为全球最强数学大模型，支持中文，可解决竞赛级试题。UBC华人研究员提出的ADAS系统让AI能自动设计强大的智能体，展现了AI自我进化的新方向。化学领域的大语言模型应用也获得进展，可准确预测性质、设计分子。最后，AI模型的后训练秘籍被详解，后训练配方对模型性能至关重要，科技巨头方法趋同

标题: 哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合

摘要:谷歌在2023年合并Google Brain与DeepMind，成立Google DeepMind新部门。该部门推出Gemini模型，常居大模型排行榜前三。DeepMind首席执行官Demis Hassabis透露公司规划，认为AI短期被炒作，长期被低估。他强调需关注言论者背景，避免跟风。公司目标为发明新AI架构，提升模型能力。Hassabis提出AI需更好基准测试，关注多模态理解等。谷歌将通过结合专业知识，开发更强智能体。Hassabis的采访获得好评，被认为更像是科学家而非推销员。
网址: 哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合 | 机器之心

标题: 浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

摘要:浙江大学李玺教授团队的新研究ScanFormer，该研究提出了一种高效的视觉语言任务模型，通过迭代感知框架提升指代表达理解。该模型在图像处理上采用粗到细的迭代方法，节省计算资源，提高精度。论文已在多个数据集上展示接近前沿的性能，且推理速度达到实时。该团队欢迎优秀工作分享，可通过指定邮箱投稿。
网址: 浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余 | 机器之心

标题: 哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

摘要: 阿里千问大模型团队发布Qwen2-Math Demo，成为全球最强数学大模型，支持图片上传解题，中文适用。该模型能解决竞赛级试题，准确率高，已超越GPT-4o等模型。用户可通过抱抱脸平台试玩。未来，团队将把多模态能力和数学推理结合到一个模型上。
网址: 哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用 | 量子位

标题: AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

摘要: 研究人员提出了一种名为智能体自动化设计（ADAS）的系统，使AI能够自动创建强大的智能体。该系统采用“元智能体搜索”算法，可自我进化，设计的智能体在跨领域/跨模型转移时表现出优越性和稳健性。实验证明，该系统可显著提升智能体性能，为自动设计更强大的智能体系统展示了新方向，有望推动AGI的发展。
网址: AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%|智能体|AI|ADAS_新浪新闻

标题: 综述：大语言模型与自主智能体在化学中的应用

摘要: 科技记者提炼： Andrew D.White团队论文介绍大语言模型（LLMs）在化学领域的应用，其能准确预测性质、设计分子等。论文综述LLMs历史、能力及挑战，聚焦于“智能体”在化学研究中的有效性。讨论了智能体的开发方向，包括人类在环的多智能体系统。领域发展迅速，已建立库跟踪研究。LLMs在化学中的挑战包括数据质量、新化学结构设计等，自主智能体或成加速研究的关键。高质量数据是发展AI驱动数字化学家瓶颈。
网址: 综述：大语言模型与自主智能体在化学中的应用 - 智源社区

标题: Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

摘要: AI巨头们的模型后训练方法正成为研究焦点。Allen AI的Nathan Lambert概述了最新趋势，包括合成数据的高效使用、迭代训练、人类偏好标签和大量数据过滤。研究表明，后训练配方对模型性能至关重要，且科技巨头使用的方法趋同。RLHF（强化学习人类反馈）的可扩展性成为关键，合成数据的重要性被强调，而数据质量被认为是“王者”。
网址: Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍 - 智源社区