快速射電暴(FRB)是近年來與引力波同樣熱門的天文學研究對象,是一類瞬時亮度超過太陽上億倍的超常射電爆發(fā)。它們能在比你眨眼快一百倍的時間內(nèi),完成一次極高的能量釋放。如何高效而精準地捕捉這些神秘的信號?中國科學家引入機器學習算法,從5.6億個疑似信號中找到81個快速射電暴候選體。
這是中科院紫金山天文臺與中國科學技術大學、上海交通大學、貴州師范學院,以及澳大利亞聯(lián)邦科學與工業(yè)研究組織、西悉尼大學、西澳大學等開展中澳合作項目的研究成果,近期在英國《皇家天文學會月刊》在線發(fā)表。
快速射電暴:來自遙遠宇宙的神秘電波
本篇論文的通訊作者、中澳天文聯(lián)合研究中心ACAMAR博士后張松波告訴記者,快速射電暴(FRB)是近年來與引力波同樣熱門的天文學研究對象。它們能在比你眨眼快一百倍的時間內(nèi),完成一次極高的能量釋放,瞬時亮度超過太陽上億倍。
這種來自于遙遠宇宙的神秘電波,究竟來自什么樣的天體?這激發(fā)了眾多天文學家的興趣。
張松波說,自2007年第一起快速射電暴被發(fā)現(xiàn)以來,經(jīng)過十多年研究,科學家取得了相當多的觀測突破,包括發(fā)現(xiàn)了可重復的快速射電暴,確定大部分快速射電暴是來自銀河系外,并觀測到了第一次銀河系內(nèi)的快速射電暴等。
“快速射電暴的研究難點就在于‘快速’二字,它的持續(xù)時間一般從微秒到毫秒量級,在一片漆黑的天空當中突然出現(xiàn)又快速消失,因此無論是在數(shù)據(jù)中找到這些信號,還是對這些信號進行深入分析,都非常困難?!睆埶刹ㄕf,隨著望遠鏡技術的發(fā)展,被探測到的快速射電暴的樣本數(shù)量也從大大提升,目前為止已經(jīng)有數(shù)百例快速射電暴信號被發(fā)現(xiàn)。但是,迄今為止,快速射電暴的起源和爆發(fā)機制依然是未解之謎。
對快速射電暴進行“人口普查”
記者了解到,中國科學院紫金山天文臺高能時域天文研究團組最近幾年開展快速射電暴研究,已經(jīng)完成的主要工作之一是利用帕克斯望遠鏡的觀測數(shù)據(jù),構建了一個完整的單脈沖數(shù)據(jù)庫。該數(shù)據(jù)庫內(nèi)包含了5.6億個信噪比大于7的單脈沖疑似信號。
“由于疑似信號中摻雜著大量的噪聲和人造信號。那些比較明亮的真正的快速射電暴,因為置信度高,得以優(yōu)先被挑出來。但剩下的信號,按照傳統(tǒng)的方法,只能由有經(jīng)驗的天文學家用肉眼來識別?!睆埶刹ㄕf,這顯然是一項不可能完成的任務,每天能看三萬張圖像,要看完5.6億個疑似信號也需要50年無休。
面對大數(shù)據(jù)挑戰(zhàn),就需要建設一套方法,讓真正有價值的數(shù)據(jù)被篩選和記錄下來。這時候,AI登場了。
機器識別如何“代替”人眼“大海撈針”?
張松波及其所在的紫金山天文臺高能時域天文團組博士研究生楊軒、孫天瑞等人引入機器學習算法,訓練殘差神經(jīng)網(wǎng)絡對所有信號進行圖像識別,開發(fā)出了一套能對所有候選體信號進行統(tǒng)一、高效的篩選機制,并將之應用到了基于帕克斯望遠鏡數(shù)據(jù)構建的單脈沖數(shù)據(jù)庫中。
楊軒解釋說,機器學習中的殘差神經(jīng)網(wǎng)絡是人工神經(jīng)網(wǎng)絡的一個變種,它模擬最基本的生物神經(jīng)元,將接收到的信號進行分析,并判別信號的種類,就如同人眼一般?!岸煳膶W家需要做的,就是手動標記一批信號,作為機器的教科書,教導他們哪些信號是假信號,哪些信號是快速射電暴。一旦教學完成,機器就可以代替人眼來對這些信號圖片進行識別了?!?/p>
打了個比方,就好比在日常生活中經(jīng)常需要進行“人臉識別”,這其中就用到了機器學習方法。天文學家的工作就相當于要訓練一個能從5億多只的狗群里把幾只貓?zhí)舫鰜淼臋C器。當然,快速射電暴不管從形態(tài)上,還是訓練樣本的收集上都比貓和狗要困難。
來源 視覺中國
篩選出81個新的快速射電暴候選體
最終,團隊運用訓練好的模型,從數(shù)據(jù)庫里找出了81個新的快速射電暴候選體。“這次發(fā)現(xiàn)一次性增加了81例,不僅有了數(shù)量上的突破,并且解決了以往對于暗弱快速射電暴的搜尋難題。為大樣本,大數(shù)據(jù)難題下的數(shù)據(jù)處理問題提供了一個解決方法?!睆埶刹ㄕf,如今全球正在建設更多、更大的新的射電望遠鏡,中國500米口徑球面射電望遠鏡(FAST)、澳大利亞平方公里陣探路者望遠鏡(ASKAP),以及正在建設中的平方公里陣列望遠鏡(SKA)都正在或即將展現(xiàn)更高的靈敏度,同時也將帶來更為驚人的數(shù)據(jù)量。
銀道坐標系下帕克斯望遠鏡觀測天區(qū)的空間分布圖。橙色星號展示了81個快速射電暴候選體的分布
“未來的天文觀測必將是大數(shù)據(jù)的時代,人工智能則是最可行的解決方案?!睆埶刹ㄕf,隨著望遠鏡技術的不斷發(fā)展,我們接收宇宙中信號的能力越來越強,這意味著我們所得到的數(shù)據(jù)越來越多。而天文學中的很多信號往往具有復雜的結構,靠人為設置條件篩選已經(jīng)無法滿足日益增長的海量數(shù)據(jù)。機器學習能夠從包含復雜干擾的圖片中找到來自宇宙的真實信號,極大地加速了的研究速度。
中國“天眼” 來源 視覺中國
該論文第一作者為楊軒,通訊作者是張松波和吳雪峰。此項工作得到了中澳合作項目ACAMAR博士后計劃,以及國家自然科學基金委杰出青年項目和FAST專項項目等基金資助。
揚子晚報/紫牛新聞記者 于丹丹
校對 李?;?/p>
來源:紫牛新聞