幾千年來,人們仰望星星,記錄、觀察天文現象,並從中發現其運行模式。第一批天文學家所認定的天體是行星,由於行星在夜空中看似不規則的移動,因此也被希臘人稱之為「planētai」或「漫遊者 (wanderers)」。經過幾個世紀以來的研究,人們已經了解太陽系的運行模式,是地球和其他行星圍繞著太陽公轉,而太陽是一個恆星,就如同我們肉眼所看見會發光的星星一樣。


如今,在望遠鏡光學 (telescope optics)、太空飛行、數位相機和電腦等技術的幫助下,我們得以將對宇宙的了解擴展到太陽系之外,偵測並探究其他恆星周圍的行星。這些圍繞在其他恆星周圍的行星也稱之為「系外行星 (exoplanet)」,而研究系外行星能幫助我們更深入探索宇宙與人類的奧秘。太陽系之外的宇宙是什麼樣子呢?外太空還有像太陽系一樣的其他行星恆星嗎?



雖然技術的進步有助於我們探索宇宙,但尋找系外行星並不容易。若和火熱的恆星相比,系外行星是冷的、小的、沒有光亮的,這就像要從幾千英里的地方,看見探照燈旁邊飛來的螢火蟲一樣困難。然而藉助機器學習 (Machine Learning),我們在最近有了一些進展。




天文學家搜尋系外行星的主要方式,就是分析來自NASA 克卜勒任務(Kepler Mission)中的大量資料數據,並透過自動化軟體和手動方式來執行。克卜勒任務用了四年的時間觀察近20萬顆恆星,每30分鐘拍一次照片,並創造了近140億個資料點。這140億個資料點相當於大約2千兆個可能的行星軌道。這個龐大的資料量即使用最強大的電腦來分析也是非常耗時、費力的。為了讓這個分析的過程可以更有效率,我們導入機器學習來加速分析時程。
當一顆運行中的行星擋住了恆星的光線時,恆星的亮度會減小。我們以此概念為基礎,將其特徵訊號用來辨識周圍運行的行星,並運用克卜勒天文望遠鏡,在四年之間觀察並分析了20萬顆恆星的亮度。




機器學習能夠訓練電腦認識運作模式,而這對於分析大量數據來說尤其有用。機器學習技術的重點在於讓電腦從範例中學習,而不是透過編寫特定的規則。




我是Google人工智慧團隊的機器學習研究員,對於宇宙的世界相當感興趣。因此,我善用「20%計畫」(在Google,你可以利用20%的時間來做你喜歡或感興趣的事情)來開始執行這個專案。我和德州大學奧斯汀分校的天文學家Andrew接洽,共同執行這個專案。我們將機器學習技術應用在宇宙探索,並教導機器學習系統如何識別遙遠恆星周圍的行星。




我們利用超過15,000個被標記的克卜勒訊號,創造一個TensorFlow模組來辨別行星與非行星。為此,這個模型必須能辨認出真正的行星所形成的圖像,與其他天體如星斑(starspots)雙星(binary stars)所形成的圖像。當我們讓TensorFlow模組辨識從未見過的訊號時,它能以96%的準確率辨認出哪些訊號是行星,哪些是非行星。因此,我們知道這個模組成功了!




有了可行的模組,我們拍攝恆星,利用這個模組在克卜勒數據中尋找新的行星。為縮小搜尋範圍,我們研究670個已知可容納兩顆或更多的系外行星的恆星。在這樣的過程中,我們發現兩顆新行星:克卜勒80g和克卜勒90i。值得注意的是,克卜勒90i是第八個被發現圍繞克卜勒90的行星,這使它成為除了太陽系之外,第一個已知的八大行星系統。
我們利用15,000個被標示的克卜勒訊號,來訓練機器學習模組去辨認行星訊號,並利用這個模組,從670顆恆星的數據中發現新的行星,且成功發現了兩個先前被忽略的行星。




我們發現一些有趣的事實:這個新發現的行星比地球大了30%;擁有大約華氏800度的地表溫度,絕對不是你下一趟旅行的好選擇;它以14天的週期繞著恆星公轉,這代表你每兩個星期就會過一次生日。


克卜勒 90是太陽系以外第一個已知的八大行星系統。在這個星系中,行星運行的軌道更靠近恆星,而克卜勒90i每14天公轉一次。(請注意,行星的大小,以及行星與恆星的距離不在測量範圍內。)





當我們運用科技來嘗試了解宇宙時,我們以為已經可以一窺一二,但其實不然。目前為止,我們只用TensorFlow模組搜尋了20萬個恆星當中的670個,而克卜勒的數據中可能還有更多系外行星尚未被發現,未來機器學習的新思維和技術將能幫助人類進行宇宙探索,發現更多未知的領域!



本文作者:Google人工智慧研究員 Chris Shallue / 德州大學奧斯汀分校天文學家 Andrew Vanderburg