
昨日,伊隆·馬斯克正式證實,xai 的全新旗艦大型模型 grok v9-medium 已完成基礎訓練,並正式進入關鍵的監督式微調階段。該模型擁有 1.5 兆個參數,規模是目前主線 v8-small 版本(0.5 兆個參數)的三倍,不僅在規模上實現了顯著躍升,更在邏輯推理深度、多步任務分解以及長程上下文建模能力等方面取得了突破性進展。
值得注意的是,在後訓練階段,v9-medium 首次系統性地整合了由 cursor 平台提供的高品質真實編程對話資料——涵蓋了工程師們在 ide 中即時撰寫的數百萬行程式碼,以及調試筆記、重構意圖和互動式問題解決過程。這一舉措直接針對 v8-small 暴露出的核心瓶頸:訓練語料中專業工程實踐的密度不足,以及程式碼語義與開發意圖之間的脫節。透過轉向「從開發者行為中學習」的模式,xai 確保模型不再僅僅研究靜態的程式碼片段,而是內化實際編碼場景中蘊含的思維過程與協作邏輯,旨在打造一位能夠理解儲存庫層級程式碼、並自主規劃與執行複雜軟體任務的具身 ai 工程師。
目前,該模型正進行緊密的人類回饋強化學習(rlhf)準備工作,預計在 2 至 3 週後展開全面評估。首批開放使用將於六月中旬左右面向 x 平台開發者及特斯拉車載 ai 生態系統用戶。更重要的是,v9-medium 內建支援 nvidia 的 blackwell 架構,並在 fp4 量化與 moe 動態稀疏激活方面進行了深度協同優化,使測試得出的推理吞吐量提升超過 2.3 倍,每 token 成本則降低近 40%。這項技術路線標誌著 xai 從通用語言模型向垂直專屬的工程智能基礎設施轉型,其部署速度與性能表現勢必將重塑 ai 程式設計助理市場的競爭格局。