主题
AION-1:首个面向天文学的大规模多模态基础模型
时间
2025.4.13 10:30 北京时间
大纲
虽然基础模型在多个领域展现出了巨大潜力,但天文学由于其数据模态高度多样,目前仍缺乏一个统一的联合建模框架。我们提出了 AION-1,这是首个面向天文学的大规模多模态基础模型家族。
AION-1 通过一种两阶段架构,实现了异构数据类型之间的任意转换:首先是模态特定的标记化(tokenization),随后是基于 Transformer 的跨模态掩码建模。该模型在超过两亿个天体样本上进行训练,在回归、分类、生成与目标检索等任务中都表现出强劲性能。
除了在天文学中的应用,AION-1 还为构建可扩展的多模态科学基础模型提供了一个蓝图,能够无缝整合现实世界中多种异构观测数据。
论文:AION-1: Omnimodal Foundation Model for Astronomical Sciences
嘉宾
Oliver Liu 是南加州大学计算机科学专业的博士二年级学生,现由 Dani Yogatama 教授和 Willie Neiswanger 教授共同指导。对多模态基础模型非常感兴趣,最近正在探索它们作为复杂推理与科学发现代理的潜力。特别关注以下方向:
设计并理解可应用于科学模态(如(元)基因组学、物理学、蛋白质、化学与材料科学)的架构与算法;
开发基础模型的后训练及推理阶段的方法,使其具备解决复杂推理与决策问题的能力。
在加入 USC 之前,曾在西北大学与 Jorge Nocedal 教授从事连续优化方向的研究。再早之前,在卡内基梅隆大学完成了本硕连读项目,主修机器学习。
主持人

华文越,Rutgers博士毕业,张永锋老师的学生,现在是UCSB的博后,和William Wang合作,主要研究方向为llm reasoning和llm-based agent,在NLP和ML的顶会ACL EMNLP ICLR Neurips TACL等等发表多篇论文,并在ACL担任Area Chair。
入群
欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

NICE介绍
NICE(NLP AcademicExchange Platform)成立于2023.11.26,由国内外高校一线青年教师和学生共同组织。每周进行学术分享,形式包括圆桌会议、主题分享、单篇论文深度分享等,内容覆盖论文分享、科研小白入门、PhD择业等所有学术领域。至今已举办近80场分享、嘉宾100+人、全网拥有粉丝量10+万,b站和视频号一共大约20万播放量。详情见:
NICE主页
https://nice-nlp.github.io
NICE海外
https://nice-intl.github.io
b站
https://space.bilibili.com/507524288
Youtube
https://www.youtube.com/@NLPAcademicExchangePlatform