近日,智能光学成像实验室贾鹏博士带领的团队与国家天文台李楠研究员合作,建立了一种融合数值仿真和深度学习的强引力透镜检测方法。
强引力透镜是广义相对论预言的一种天文现象:当背景光源发出的光经过引力场(星系、星系团及黑洞)附近的时候,光线会像透镜一样发生弯曲。当面密度大于1时,产生的现象为强引力透镜,在强引力透镜区域会产生多个背景源的像(多像)或者圆弧(arc)。强引力透镜对于研究宇宙学、星系形成和演化等科学问题具有重要的作用,是我国空间站巡天望远镜(CSST)、欧洲Euclid卫星及美国LSST等望远镜的主要观测对象之一。从图像中检测出强引力透镜是后续开展各类科学研究的基础。由于强引力透镜尺度较大具有复杂的形态结构,因此从海量巡天观测数据中检测强引力透镜难度极高。
近年来,在AI4Science理念的驱动下,各种基于人工智能技术的天文数据处理和分析方法被纷纷提了出来,利用AI从观测图像中自动检测强引力透镜系统是一种非常有潜力的技术。通过将已发现的强引力透镜融入数据,通过训练可以使得AI具有识别强引力透镜的能力。但是,由于当前观测获取的强引力透镜数量稀少,难以形成有效的数据集;此外,现有的强引力透镜多数是通过人眼识别发现的,因此这类数据具有很强的人择性,将可能遗漏人眼难以区分的强引力透镜(例如中心被遮挡的系统)。
因此,研究团队创新地提出将产生强引力透镜的物理机制蕴含于数值仿真中,产生海量多波段模拟观测数据;同时,采用可解释的机器学习技术实现科学理论驱动的强引力查找方法。在Detection of Strongly Lensed Arcs in Galaxy Clusters with Transformers一文中,团队展示了利用transformer建立的强引力透镜检测方法和以该方法为基础的数据流水线,包括:科学先验信息注入、强引力透镜系统检测和可解释评估等。
Transformer采用多头注意力机制,能够不受局部信息干扰而对关联数据进行建模,广泛应用于自然语言处理和图像处理等领域。研究团队借鉴目标检测模型DETR,直接从多通道数据中提取特征,实现对强引力透镜系统的目标检测任务。同时,研究团队借鉴Deformable DETR结构,通过deformable transformer进行随机采样,提升了目标检测速度,同时实现对DETR检测结果的互补。研究团队提出的方法可以实现99.63% accuracy rate, 90.32% recall rate, 85.37% precision rate 和 0.23% false positive rate。
研究团队在模拟数据上的检测结果如下图所示,可见无论是否有前景星系干扰,本研究提出的办法可以有效地提取强引力透镜系统位置。同时,研究团队直接将训练后的算法用于JWST和HST的实测数据,结果如图5所示,可见项目团队提出的方法可以直接从观测图像中识别出强引力透镜。
图5. JWST和HST对同一个强引力透镜的观测数据和研究团队提出算法的结果。图上可见研究团队提出的办法能够直从模拟数据迁移至真实数据实现引力透镜系统检测。同时,通过对自注意力和交叉注意力可视化可以发现,研究团队提出的算法能够有效地locate出强引力透镜的关键部分,可以为后续的引力透镜分割和查找提供基础。
接下来,研究团队将以CSST和其他巡天观测数据为基础,搭建检测流水线,在真实数据上发现一批强引力透镜;同时,构建分割算法,为强引力透镜的后续科研提供基础。本研究主要由太原理工大学贾鹏博士、孙瑞琦、宋宇、宁润宇、韦宏艳、国家天文台李楠研究员和中南大学罗瑞合作完成。研究获得国家自然科学基金(NSFC资助号:12173027、12173062),中国载人航天工程(NO. CMS-CSST-2021-A01 and CMS-CSST-2021-B12),平方公里阵(SKA NO. 2020SKA0110102)和山西省科技创新团队专项资金等项目的科研资助。
研究代码已经过China-VO代码共享平台发布(DOI: 10.12149/101172 ),相关云服务资源由智能光学成像实验室部署,可以通过联系负责人贾鹏(robinmartin20@gmail.com)获取使用权限。
论文内容解读由太原理工大学孙瑞琦同学完成,孙瑞琦同学2019年本科毕业于中南大学,20年加入太原理工大学智能光学成像实验室开展机器学习及人工智能方面的研究,目前主导小组内扩展目标检测和应用方面的研究。
解读视频链接:
https://www.bilibili.com/video/BV1cP411w7nd/?vd_source=e86e5344a645b6011322c11b25e81c64