慕尼黑初創企業Spaitial正在構建能夠從文本或圖像中生成并理解真實與虛擬3D環境的空間基礎模型(SFMs),致力于開發具備物理空間認知能力的新一代AI系統。
這家在慕尼黑和倫敦設有辦公室的AI公司,其核心技術聚焦于生成和理解復雜3D世界。不同于當前基于像素或文本的生成式AI,SFMs直接操作幾何結構、材質和物理屬性,旨在賦予AI對時空的物理基礎認知——這正是現有模型的重大缺陷。
長遠來看,這種物理理解能力將成為"世界模型"的基石——即AI智能體學習在復雜動態虛擬環境中導航與行動的底層架構。
從簡單輸入到逼真3D場景
Spaitial宣稱,其SFMs僅需單張圖片、短視頻片段或文字提示,即可生成具備物理準確性的照片級3D場景,用戶還能從任意視角交互探索。通過從平面2D輸出轉向時空錨定的3D表征,該系統能實現更高一致性,這對物理過程模擬或動態環境導航等任務至關重要。
該技術可應用于游戲/影視/ARVR等沉浸式媒體、規劃仿真用的數字孿生、自主機器人訓練,以及工業/城市基礎設施建模。例如實時模擬生產設施,或提升自動駕駛設備的環境理解能力。
學術積淀與商業經驗的融合
Spaitial近期完成了由Earlybird Venture Capital領投的1300萬美元種子輪融資,Speedinvest及多位知名天使投資人跟投,包括Black Forest Labs的Robin Rombach、Synthesia的Victor Riparbelli與Steffen Tjerrild等。資金將用于推進SFM技術研發、基礎設施建設和團隊擴張,公司還計劃與商業伙伴開展應用測試,感興趣者可加入候補名單。
創始團隊匯聚頂尖技術專家與商業人才:
Matthias Niessner:慕尼黑工業大學教授,虛擬化身公司Synthesia聯合創始人
Ricardo Martin-Brualla:曾任谷歌生成式3D技術研究員
David Novotny:Meta數字孿生項目前成員
Luke Rogers:麥肯錫及Cazoo前高管
核心團隊還包括:
Katja Schwarz:早期生成式3D模型GRAF/VoxGRAF共同開發者
Mojtaba Bemana:以"X-Fields"論文獲2025年歐洲圖形學博士獎
精選文章: