最近一陣子,AI公司和航天公司頻繁「牽手」,想把數據中心搬進太空。有些人甚至覺得這樣能解決地面算力緊張的問題。可在真正做過航天電子的人眼裡,這幾乎註定是個爛主意。寫下這篇分析的人曾是NASA工程師,後來又在Google工作多年,負責部署AI算力。他的結論非常直接,這件事沒希望。
原因來自一個基本事實。能讓數據中心正常運作的電子設備尤其是負責AI推理和訓練的GPU和TPU所需要的環境,完全和太空環境對立。
先看能源問題。很多人以為太空「太陽能無限」。但並不是。要發電只有兩種方式,太陽能電池板或核電。太陽能其實和地面差不多,穿過大氣的損失並不大,所以你在太空里得到的單位面積發電量不會比在地球上高出幾個數量級。國際空間站目前是地球軌道上最大的一組太陽能陣列,總面積約2500平方米,最理想情況也只有二十多萬瓦電力。
拿NVIDIA的H200算力卡做參照。每一塊GPU實際運行需要接近1千瓦。也就是說,一個國際空間站級別的太陽能陣列,大概只能勉強支撐兩百塊GPU。聽起來不少,但我們看看現實。OpenAI準備在挪威的新數據中心裡放十萬塊GPU。要在太空實現同等級別,就得發射五百個國際空間站規模的衛星。這完全是天文級別的荒唐。
核能也別想。軌道衛星用的不是核反應堆,而是放射性同位素熱電機。它們只有幾十瓦到一百多瓦的功率,連一塊GPU都帶不動,更別說成千上萬。
能源不夠只是開頭。更致命的問題是散熱。有人以為太空很冷,所以散熱很容易,但這其實是最常見誤解。太空是接近完全真空,根本沒有空氣流動。地面散熱的主力機制是對流,用風扇吹散熱片,或者用液冷把熱量帶到別處。但在太空里,沒有空氣,只有靠固體傳導和輻射散熱。
國際空間站的散熱系統是液氨循環結合大型散熱板。這套系統能處理約一萬六千瓦的熱量,也就是十幾塊高功耗GPU的級別。想讓兩百塊GPU正常散熱,就必須造一個面積超過五百平方米的巨大散熱結構,比太陽能陣列還大上好幾倍。結果就是,為了三排機架的數據量,你要造一個比國際空間站更龐大的怪物衛星。
如果這一切你都解決了,太空輻射會讓你重新懷疑人生。軌道不同,輻射環境也不同。在低軌道還算溫和,但到了中軌甚至外層軌道,就要面對太陽和宇宙射線不斷轟擊。高速粒子穿過半導體,會造成瞬態錯誤、單粒子翻轉、甚至把晶體管直接燒死。
AI晶元在這點上屬於最糟糕的材料。它們晶體管密度極高,結構極小,面積巨大,連普通計算機遇到的單粒子事件已經夠可怕了,而GPU的敏感度要高得多。長期駐留太空,晶元會因為累積劑量效應逐漸變慢、功耗變高、最終不穩定。你想用屏蔽材料也不現實,屏蔽越厚,反衝粒子越多,反而更糟。
地面數據中心依賴的所有東西太陽能、電網供電、冷卻系統、維護周期、晶元穩定性在太空里都變成難以跨越的工程深淵。要讓這些昂貴的衛星長期工作,還得應對機械疲勞、姿態控制、電池老化、微隕石撞擊。每一個環節都比在地面難百倍。
把AI算力搬去太空聽上去像科幻,但工程上完全行不通。目前這些合作與宣傳更像是趕風口的噱頭。現實中,太空擁有的不是「無限能源和零成本冷卻」,而是更強烈、更殘酷、更難處理的物理條件。
當我們把複雜的技術幻想重新落在物理層面,事情會立刻變得樸素。地面數據中心的問題不能通過把它們送上天來解決。真正的技術突破,還是得發生在地球上,無論是晶元結構、散熱方式還是能源效率。
