騰訊游戲攜手中科院高能所粒子天體物理重點實驗室,公布“ai技術實現天文衛星星座的協同觀測”合作項目

2022年6月27日,騰訊游戲宣布將以人工智能(ai)技術助力中科院高能所粒子天體物理重點實驗室“全變源追蹤獵人星座”(catch:chasing all transients constellation hunters)計劃,該合作有望將我國空間天文觀測技術推向新的高度,并且在時域天文學的后隨觀測上做出重要貢獻 。
catch計劃是粒子天體物理重點實驗室提出的、由上百顆微衛星組成的智能化x射線天文星座,計劃于2030年前后全面部署,其核心科學目標是“刻畫極端宇宙的多維度動態全景” 。騰訊游戲和粒子天體物理重點實驗室的合作致力于推動多智能體強化學習算法在catch星座的協同觀測方面的應用 。屆時,catch計劃將利用騰訊游戲在業界領先的ai技術,實現星座的在軌自主協同觀測等功能 。
騰訊游戲cros ai研發團隊在游戲中訓練的ai智能體已達到頂尖玩家的水準;該團隊還創新地推出了人機協作、人機對抗等應用,在豐富了玩家體驗的同時,提升了協作效率 。隨著ai技術的不斷發展,人機協作在過去的探索中取得了較好的應用效果,“理解-溝通-協作”的方式也幫助系統更高效地實現了既定目標 。
catch星座在ai技術配合下協同觀測目標天體的想象圖
正如騰訊游戲cros ai研發團隊所開發的ai智能體,其智能與敏捷源于學習沉淀自上億局“人機模式”游戲對戰的經驗;catch計劃所使用的多智能體協同算法也在“深度學習”過往的天文觀測數據 。目前,騰訊游戲的算法工程師們結合我國天文衛星的爆發源數據,初步搭建了爆發源仿真模擬器,用以訓練專屬于太空觀測環境的ai算法 。當catch星座在太空中運行時,將借助上述算法對深空中成千上萬的爆發源數據進行實時分析,調度衛星執行目標選擇、指向調整、編隊組合等觀測指令,對觀測目標進行全天、全時監測,后期還將根據觀測結果進行持續性的算法優化 。
如何操控上百顆衛星更高效地觀測宇宙中的爆發源和變源天體?早在catch概念提出的時候,科學家們就意識到了這樣的挑戰 。以傳統的經驗來看,單顆衛星的天文觀測往往就需要一支專門的團隊來運行;而對于體量高達百顆衛星的catch星座來說,這似乎是一個不可能完成的任務 。為此,騰訊游戲cros ai研發團隊與空間和天文方面的專家進行了充分的討論,提出了更為理想的解決方案:利用游戲ai較新的訓練技術——多智能體強化學習方法,來控制衛星協同合作,完成各類觀測任務,實現觀測計劃的較優化 。
具體來說,該團隊為模型訓練配備了高并發的分布式環境,可以支持接入上萬路模擬環境同時訓練,還能利用訓練樣本,進行分布式訓練;同時結合團隊較新研發的模型壓縮、部署優化方案,以便有效地平衡空間信號的感知、控制精度的要求和衛星算力的限制,高效地完成多顆衛星的協同觀測任務 。這一方案既包含滿足科研目的的精度要求,也符合太空環境實時調度的算力要求,還能夠支持大規模算力的基礎系統架構要求 。
騰訊游戲ai多智能體算法早前已經應用在英雄聯盟手游、火影忍者手游等多人在線戰術競技游戲中 。具體來說,游戲ai可以通過多智能體深度學習與強化學習訓練,使其自身對戰水平得以匹配大多數玩家的水平 。在“去中心化”的多智能體算法調度下,游戲ai不僅可以和玩家進行能力配合,還能使玩家體驗到不同風格的戰術 。另外,在針對游戲ai的訓練中,提升輸出強度并非單一的訓練目標,而是需要平衡一系列的量化指標:從戰斗能力、防守能力,到與隊友的配合程度等,多維度量化分析較優博弈策略,并通過不斷優化訓練參數,提升游戲ai的綜合性能 。