AI大模型日报#0529：杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

本文链接：https://blog.csdn.net/lionkingcz/article/details/139307156

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！

目前采用“文心一言”（ERNIE 4.0）、“零一万物”（Yi-34B）生成了今日要点以及每条资讯的摘要。欢迎阅读！

《AI大模型日报》今日要点：前字节跳动大语言模型专家杨红霞离职创业，专注开发端侧AI模型，其团队已获数千万美元投资，投后估值达1.5亿美元。端侧模型因成本低、移动性强及数据安全优势，正成为行业新宠。教育科技方面，网易有道推出了“子曰”教育大模型及三大AI创新应用，包括AI全科学习助手、新一代虚拟人口语教练与知识库问答引擎，强化其在AI商业化领域的领先地位，并积极参与行业大模型标准制定。在科研领域，香港理工大学等机构联合开发的上下文分子微调方法，为大语言模型在化学任务上的应用提供了新范式，显著提升了模型在分子描述与结构间翻译的能力。字节跳动研究人员提出的物理引导方法，通过新的扩散模型让蛋白质动起来，填补了AlphaFold3在蛋白质动态行为刻画上的空白，为药物设计和生物过程理解提供了更强大的工具。此外，OpenAI在经历高层变动后，正致力于开发新一代大模型，并加强安全保障工作，而竞争对手Anthropic则挖角了OpenAI前研究人员，双方在大模型领域的竞争愈发激烈。另一方面，阿里云开发了首个全生物系统的核酸与蛋白语言融合模型LucaOne，其训练推理代码已开源，并在多种生物任务中表现出色，为AI在生物科学的应用开辟了新路径。最后，在蚂蚁集团首次对外开放的技术日上，众多基于大模型的创新应用亮相，凸显了AI在智能生活、金融、医疗健康等领域的广泛潜力与落地进展。

标题: 独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元
摘要: 字节跳动前大语言模型专家杨红霞离职创业，专注于开发端侧AI模型，目标是打造AI Agent。她的团队已获得数千万美元投资，估值1.5亿美元。杨红霞曾领导阿里达摩院的M6模型项目，并在字节跳动AI Lab担任要职。随着通用大模型格局收缩，端侧模型因其成本低、移动性强、数据安全等优势，成为行业新热点。
网址: 独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元|ai|杨红霞|端侧模型|视频生成模型|陈伟_手机网易网

标题: 持续领跑教育科技，有道再发「子曰」教育大模型全新应用

摘要: 网易有道在北京举行了“子曰”教育大模型媒体交流会，展示了其最新技术进展和三大AI创新应用：AI全科学习助手“有道小P”APP、新一代虚拟人口语教练Hi Echo 3.0和新一代知识库问答引擎QAnything。CEO周枫强调了“模型即应用”的时代，并表示有道将聚焦场景开拓和应用落地，提升产品效率和交互体验。有道已推出超10款大模型落地应用，并在AI商业化上取得突破性进展，一季度会员销售额同比增长140%。有道还参与了行业大模型标准制定工作，助力国家大模型产品发展。新应用“有道小P”集成了多种场景下的互动答疑与交互功能，并将在手机端便捷使用。Hi Echo 3.0则针对中国学生学习英语的需求，提供了雅思口语练考服务。QAnything作为企业AI大脑，已服务了20多个行业的上百家客户。有道积极拓展多样化的应用场景，并不断提升模型能力，同步提升模型和产品。
网址: 持续领跑教育科技，有道再发「子曰」教育大模型全新应用 | 机器之心

标题: 为百亿参数LLM化学应用提供新范式，香港理工大学提出上下文分子微调

摘要: 香港理工大学、上海交通大学和上海人工智能实验室的研究人员联合发表了一篇论文，介绍了他们开发的上下文分子微调（ICMA）方法，这是一种新颖的范式，用于在大语言模型中进行分子-描述翻译。ICMA通过混合模态上下文召回、召回后重排和上下文分子微调三个阶段，提高了模型在分子和分子文本描述之间进行翻译的能力。研究人员在ChEBI-20和PubChem324K数据集上进行了实验，结果显示ICMA能够显著提升性能，甚至接近或达到最新的基准水平。该方法的贡献在于它不需要额外的领域预训练，为大语言模型在化学任务上的应用提供了新的思路，并通过学习上下文例子中分子描述片段与分子SMILES结构的对应关系，精细化了分子描述和分子的对齐。此外，ICMA对模型的大小和类型不那么敏感，即使是较小的模型也能获得性能提升。这项研究表明，大语言模型可以成为上下文分子学习的有效工具，为科学领域的应用提供了新的方法和思路。
网址: 为百亿参数LLM化学应用提供新范式，香港理工大学提出上下文分子微调 | 机器之心

标题: 填补AlphaFold3空白，字节跳动提出物理引导的方法让蛋白质动起来

摘要: 科技记者报道：世界在不断变化，分子也在持续运动，这使得对蛋白质等生物分子的功能研究需要从静态单一结构预测转向动态构象分布的探索。这种转变对于理解蛋白质与其他分子的相互作用、识别潜在药物位点以及设计更具特异性和效力的治疗药物至关重要。然而，传统的分子动力学模拟方法因其昂贵和耗时的特性，难以跨越长的时间尺度来观察重要的生物过程。近年来，深度学习在蛋白质结构预测领域取得了显著进展，但包括Deepmind的AlphaFold 3在内的模型仍然主要专注于预测静态单一结构，对蛋白质动态行为的刻画还不够充分。为了解决这一问题，来自字节跳动 ByteDance Research 的研究人员提出了一种名为CONFDIFF的蛋白质构象生成扩散模型。该模型利用物理知识来引导模型与真实世界对齐，同时规避了实时力场和能量计算的复杂性，相比传统方法有巨大的加速。 CONFDIFF模型在SE(3)空间上构建了一个非条件的生成扩散模型，通过预测主链原子坐标和主链朝向来构建蛋白质构象。为了充分利用先验结构和序列信息，CONFDIFF使用目标序列的预训练表示训练了一个基于序列的条件生成模型来引导上述的非条件模型，使生成构象既多样化又符合相应的结构与序列约束。为了使分布符合能量玻尔兹曼分布，研究者提出了能量与力场引导方法，其中最重要的是计算中间时刻的能量梯度（即力场）。研究者使用神经网络来预测这个量，并创新性提出了两种匹配训练方法并推导了相应公式。在快速折叠蛋白质和牛胰蛋白酶抑制剂两种包含分子动力学模拟生成构象的蛋白质数据集上，CONFDIFF模型在预测构象分布和预测残基接触等方面表现优于其他模型。力场引导的方法也相对更优于能量引导的方法。这项研究为扩展蛋白质结构的探索提供了新的工具，有助于更准确地预测蛋白质动态构象，为药物设计和生物过程的理解提供了强有力的支持。
网址: 填补AlphaFold3空白，字节跳动提出物理引导的方法让蛋白质动起来 | 机器之心

标题: 奥特曼挂帅新团队，OpenAI新一代大模型开训，前任高管却「投敌」了

摘要: OpenAI，一家领先的人工智能研究公司，正在开发其下一个前沿模型，预计将显著提升其在实现通用人工智能（AGI）方面的能力。这一消息是在公司经历了一系列高层变动和安全问题争议之后发布的。联合创始人兼首席科学家Ilya Sutskever宣布离职，超级对齐团队也被解散，引发了外界对OpenAI研究安全性的担忧。为了应对这些担忧，OpenAI董事会宣布成立新的安全与保障委员会，由董事会主席Bret Taylor、董事Adam D’Angelo和Nicole Seligman、以及首席执行官山姆・奥特曼领导。该委员会的任务是在未来90天内评估并进一步发展OpenAI的开发流程和保障措施，并向董事会提出建议。安全与保障委员会的成立是OpenAI在加强其安全工作方面的一个重要步骤，也是对过去争议的一种回应。前董事会成员Helen Toner在播客节目中透露，前董事会是在Twitter上得知ChatGPT发布的，这表明了董事会与管理层之间存在沟通问题。Toner还讲述了导致董事会成员不再信任奥特曼的原因，以及奥特曼最终如何重回OpenAI。在安全团队重组的同时，前OpenAI超级对齐团队的共同领导者Jan Leike宣布加入竞争对手Anthropic，继续从事超级对齐研究。Leike的离开是由于他与OpenAI领导层在公司核心优先事项上存在长期分歧。总体而言，OpenAI在追求技术进步的同时，正努力解决安全和治理问题，以确保其人工智能的发展能够造福全人类。
网址: 奥特曼挂帅新团队，OpenAI新一代大模型开训，前任高管却「投敌」了 | 机器之心

标题: AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

摘要: 科技记者报道：阿里云飞天实验室生物智能计算团队开发了首个全生物系统的核酸语言+蛋白语言的融合基座模型，名为LucaOne。该模型不仅能识别DNA、RNA与相应蛋白质之间的内在联系，还在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中表现出色。LucaOne的训练推理代码及相关数据目前均已开源，与未开源的AlphaFold 3形成鲜明对比。LucaOne在核酸序列和其对应蛋白的正负样本数据集中，预测准确率高达0.85，远超业内最好预训练模型组合。此外，LucaOne在流感H3N2病毒疫苗有效性预测中准确率可达100%。这一突破性进展为AI在生物科学领域的发展开辟了新的篇章。
网址: AlphaFold 3不开源，统一生物语言大模型阿里云先开了！ | 量子位

标题: Ilya左膀右臂被Claude团队挖走！奥特曼砍掉的超级对齐算力，Anthropic给了

摘要: 科技记者报道：前OpenAI研究人员Jan Leike，在离开OpenAI超级对齐团队后，宣布加入Anthropic，继续致力于AI安全研究。Leike的加入为Anthropic带来了宝贵的经验，他将专注于可扩展监督、泛化能力和自动对齐技术。Anthropic，由前OpenAI员工创立，强调对AI安全的重视，并得到了包括亚马逊在内的多家公司的投资。随着Claude 3的发布，Anthropic已成为OpenAI的有力竞争对手。在国内，类似的人才流动也在发生，如字节跳动前员工杨红霞离职创业，以及微软资深首席研究员段楠加入大模型创业公司阶跃星辰。这些变动预示着大模型领域的竞争将更加激烈。
网址: Ilya左膀右臂被Claude团队挖走！奥特曼砍掉的超级对齐算力，Anthropic给了 | 量子位

标题: 蚂蚁技术日首次对外开放，各种大模型应用看花了

摘要: 蚂蚁集团首次对外开放技术日，展示了一系列基于大模型的创新应用，包括智能生活、金融、医疗健康管家，以及AI智绘、AI智乐、AIGC数字人等。这些应用通过支付宝小程序即可体验。蚂蚁集团CTO何征宇强调了AI规模化落地的三个关键因素：可靠性、经济性和易用性。蚂蚁正致力于将这些技术融入日常生活中，让AI像扫码支付一样便利每个人的生活。
网址: 蚂蚁技术日首次对外开放，各种大模型应用看花了 | 量子位