AI大模型日报#0821:谷歌想创造第二个Transformer、阿里发布最强数学大模型

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:谷歌新成立的Google DeepMind部门推出的Gemini模型在大模型排行中表现优异,公司计划发明新AI架构并提升模型能力。浙江大学李玺团队提出的ScanFormer模型通过迭代感知框架提升视觉语言任务效率。阿里发布的Qwen2-Math成为全球最强数学大模型,支持中文,可解决竞赛级试题。UBC华人研究员提出的ADAS系统让AI能自动设计强大的智能体,展现了AI自我进化的新方向。化学领域的大语言模型应用也获得进展,可准确预测性质、设计分子。最后,AI模型的后训练秘籍被详解,后训练配方对模型性能至关重要,科技巨头方法趋同


 
标题: 哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合
 


摘要:谷歌在2023年合并Google Brain与DeepMind,成立Google DeepMind新部门。该部门推出Gemini模型,常居大模型排行榜前三。DeepMind首席执行官Demis Hassabis透露公司规划,认为AI短期被炒作,长期被低估。他强调需关注言论者背景,避免跟风。公司目标为发明新AI架构,提升模型能力。Hassabis提出AI需更好基准测试,关注多模态理解等。谷歌将通过结合专业知识,开发更强智能体。Hassabis的采访获得好评,被认为更像是科学家而非推销员。
网址: 哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合 | 机器之心
 
标题: 浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余
 


摘要:浙江大学李玺教授团队的新研究ScanFormer,该研究提出了一种高效的视觉语言任务模型,通过迭代感知框架提升指代表达理解。该模型在图像处理上采用粗到细的迭代方法,节省计算资源,提高精度。论文已在多个数据集上展示接近前沿的性能,且推理速度达到实时。该团队欢迎优秀工作分享,可通过指定邮箱投稿。
网址: 浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余 | 机器之心
 
标题: 哪里不会扫哪里!全球最强数学大模型发布人人可玩Demo,阿里多模态模型加持,中文适用
 


摘要: 阿里千问大模型团队发布Qwen2-Math Demo,成为全球最强数学大模型,支持图片上传解题,中文适用。该模型能解决竞赛级试题,准确率高,已超越GPT-4o等模型。用户可通过抱抱脸平台试玩。未来,团队将把多模态能力和数学推理结合到一个模型上。
网址: 哪里不会扫哪里!全球最强数学大模型发布人人可玩Demo,阿里多模态模型加持,中文适用 | 量子位
 
标题: AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
 


摘要: 研究人员提出了一种名为智能体自动化设计(ADAS)的系统,使AI能够自动创建强大的智能体。该系统采用“元智能体搜索”算法,可自我进化,设计的智能体在跨领域/跨模型转移时表现出优越性和稳健性。实验证明,该系统可显著提升智能体性能,为自动设计更强大的智能体系统展示了新方向,有望推动AGI的发展。
网址: AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%|智能体|AI|ADAS_新浪新闻
 
标题: 综述:大语言模型与自主智能体在化学中的应用
 


摘要: 科技记者提炼: Andrew D.White团队论文介绍大语言模型(LLMs)在化学领域的应用,其能准确预测性质、设计分子等。论文综述LLMs历史、能力及挑战,聚焦于“智能体”在化学研究中的有效性。讨论了智能体的开发方向,包括人类在环的多智能体系统。领域发展迅速,已建立库跟踪研究。LLMs在化学中的挑战包括数据质量、新化学结构设计等,自主智能体或成加速研究的关键。高质量数据是发展AI驱动数字化学家瓶颈。
网址: 综述:大语言模型与自主智能体在化学中的应用 - 智源社区
 
标题: Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍
 


摘要: AI巨头们的模型后训练方法正成为研究焦点。Allen AI的Nathan Lambert概述了最新趋势,包括合成数据的高效使用、迭代训练、人类偏好标签和大量数据过滤。研究表明,后训练配方对模型性能至关重要,且科技巨头使用的 方法趋同。RLHF(强化学习人类反馈)的可扩展性成为关键,合成数据的重要性被强调,而数据质量被认为是“王者”。
网址: Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍 - 智源社区
 

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

常政

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值