用于星系的人脸识别:人工智能为天文学带来新工具

【概要】名为“深度学习”的机器学习方法被广泛应用于人脸识别以及其他图像和语音识别应用程序,该方法在帮助天文学家分析星系图像及了解它们如何形成和演变方面展示了潜力。

在一项新研究中,科研人员使用计算机模拟星系的形成来训练深度学习算法,该算法随后被证实在分析来自哈勃空间望远镜(Hubble Space Telescope)的星系图像方面表现异常出色。这项研究的成果已发表在《天文物理期刊》(Astrophysical Journal

科研人员利用来自模拟的输出结果生成被模拟星系的模拟图像,就像使用哈勃空间望远镜对其进行观测时看到的一样。模拟图像被用于训练深度学习系统,使其能够识别之前在模拟中确定的星系演变的三个关键阶段。科研人员随后为该系统提供大量真实的哈勃图像用于分类。

结果表明,神经网络对模拟星系和真实星系的分类具有高度一致性。“我们并没有指望它会如此成功。我对它的强大能力感到吃惊,”参与研究的乔尔·普里马克(Joel Primack)说道他是加利福尼亚大学圣克鲁斯分校(UC Santa Cruz)物理学荣誉教授兼圣克鲁斯粒子物理研究所(Santa Cruz Institute for Particle PhysicsSCIPP)成员。“我们知道模拟存在局限性,因而我们不想发表太过确定的主张,但我们不认为这只是好运气的意外收获。”

星系是复杂的现象,其外观会在数十亿年的演变过程中改变,而星系图像只能提供其在各个时间点的快照。天文学家可以更深入地观察宇宙,从而“回到过去”查看早期的星系(因为光在宇宙距离上传播所需的时间),但跟踪单个星系随时间演变的过程却只能通过模拟实现。将模拟的星系与观测到的星系进行比较可以揭示真实星系及其可能历史的重要细节。

1蓝核

在这项新研究中,科研人员对富含气体的星系的早期演变模拟中发现的以下现象尤其感兴趣:当大量气体流入星系的中心时,星系的中心会形成一个小而密集的恒星形成区域,称为“蓝核”。年轻、炽热的恒星会发出“蓝色”短波长光,因此蓝色表示具有活跃恒星形成的星系,而较为衰老、温度较低的恒星则会发出更多的“红色”光。

计算机程序在模拟数据和观测数据中都有以下发现:“蓝核”阶段只在质量属于特定范围的星系中发生。中心区域的行星形成随后会平息,带来紧凑的“红核”阶段。质量范围的一致性是令人兴奋的发现,因为它表明深度学习算法正在自行确定真实星系中发生的重要物理过程的模式。

“这有可能是因为,在一定的大小范围内,星系刚好具有让这一物理过程发生的质量,”加利福尼亚大学圣克鲁斯分校天文学和天体物理学荣誉教授戴维·库(David Koo)说道。

科研人员使用了由普里马克和国际协作者团队开发的最先进的星系模拟(VELA模拟),这些协作者包括运行模拟的丹尼尔·塞韦里诺(Daniel Ceverino,海德堡大学)和领导模拟的分析和解释并据此发展出新物理概念的艾维沙·德克尔(Avishai Dekel,希伯来大学)。但是,所有此类模拟在捕获星系形成的复杂物理特性方面均能力有限。

需要特别指出的是,本研究中使用的模拟不包括来自活跃星系核(galactic nuclei)的反馈(中心超大质量黑洞吸收气体时,通过辐射注入能量)。许多天文学家认为这一过程是调节星系中恒星形成的重要因素。尽管如此,对遥远、年轻星系的观测似乎表明存在相关证据,可证实模拟中看到的导致蓝核阶段的现象。

2CANDELS

对于观测数据,该团队使用了通过CANDELS项目(宇宙近红外超深空组合河外星系遗产巡天,Cosmic Assembly Near-infrared Deep Extragalactic Legacy Survey)获得的星系图像。该项目是哈勃空间望远镜有史以来规模最大的项目。第一作者马克·韦尔塔斯-孔帕尼(Marc Huertas-Company)是巴黎天文台(Paris Observatory)和巴黎第七大学(Paris Diderot University)的天文学家,他已经完成了使用公开可用的CANDELS数据将深度学习方法应用于星系分类方面的开创性工作。

CANDELS合作研究员库邀请韦尔塔斯-孔帕尼访问加利福尼亚大学圣克鲁斯分校来继续这项工作。谷歌通过向库和普里马克提供研究基金捐赠,为他们在天文学方面的深度学习工作提供支持,这让韦尔塔斯-孔帕尼得以在圣克鲁斯度过两个夏天,并计划在2018年的夏天再次来访。

“这个项目只是我们几个想法中的一个,”库说道。“我们想要挑选一个理论学家可以基于模拟明确定义的过程,并且这个过程应该与星系的外观有一定关系。然后,我们会让深层学习算法在观测中找到这一过程。我们刚刚开始探索这种新的研究方法。这是将理论和观测融合的新方法。”

多年来,普里马克一直与加利福尼亚大学圣克鲁斯分校的库和其他天文学家密切合作,将其团队对星系形成和演变的模拟与CANDELS的观测结果进行比较。“VELA模拟在帮助我们理解CANDELS的观测结果方面取得了很多成功,”普里马克说道,“尽管没有人拥有完美的模拟,但随着我们继续这项工作,我们将不断开发出更好的模拟。”

库表示,深度学习算法具有揭示观测数据中人类无法看到的方面的潜力。缺点在于该算法就像一个“黑匣子”,因而很难知道计算机使用数据的哪些特征进行分类。但网络询问技术可以确定图像中的哪些像素对分类贡献最大,科研人员已在其网络中对其中一种方法进行了测试。

“深度学习技术会寻找模式,而计算机可以发现因复杂程度太高而导致人类无法发现的模式,”库说道。“我们想要对这种方法进行更多测试,但在目前的概念验证研究中,计算机似乎成功地在数据中发现了模拟中确定的星系演变的不同阶段。”

他表示,在未来,由于大型巡天项目和新望远镜(例如大型综合巡天望远镜[Large Synoptic Survey Telescope]、詹姆斯·韦伯空间望远镜[James Webb Space Telescope]和广域红外巡天望远镜[Wide-Field Infrared Survey Telescope])的存在,天文学家将拥有更多可供分析的观测数据。深度学习和其他机器学习方法可成为理解这些海量数据集的强大工具。

“这是在天文学中使用高级人工智能的激动人心的阶段的开端,”库说道。

阅读更多
换一批

没有更多推荐了,返回首页