
2026年5月20日清晨,以開發者體驗為核心設計的全棧智慧雲平台「railway」遭遇了大規模服務中斷。自凌晨5時29分起,用戶普遍面臨連鎖故障,包括上游連線失敗、主控台登入異常、儀表板空白載入以及各項服務無反應等問題。更令人意外的是,初步調查顯示,問題並非源自railway自身的架構,而是來自其依賴的google cloud platform(gcp)帳戶;該帳戶在未經任何事先警告或說明的情況下,被google單方面凍結。
這場突如其來的停用立即使所有基於gcp的服務脫機。短短13分鐘內,railway的運維團隊便定位到問題所在,緊急聯繫google,並成功恢復受影響帳戶的存取權——這一驚人的回應速度為業界樹立了新標準。然而,復原過程卻遠比預期艱難:受限於現有運算資源,團隊不得不暫停所有非企業用戶的建構任務,以避免連鎖式過載;同時,多次嘗試重新啟動gcp實例均因網路層異常而屢遭挫敗,迫使他們向google技術支援尋求二級協助。截至本文發佈時,核心服務仍未完全恢復,狀態頁面上仍顯示「建構功能受限」及「間歇性存取不穩定」。
值得注意的是,這並非google cloud首次因內部作業疏失而引發嚴重事件。早在2024年,當google協助澳洲退休金巨頭unisuper進行私有化部署時,工程師因輸入關鍵參數時出現疏忽,不慎刪除了客戶的生產環境以及兩份跨區域備份副本,導致62萬名會員與總額達1,250億澳元的資產陷入兩週無從訪問的困境。儘管第三方備份最終協助找回了遺失資料,但這起事件仍暴露出gcp在權限管理、作業審計及容錯機制等方面存在的深層隱憂。
近期railway事件再次將信任危機推至焦點:當關鍵基礎設施的控制權完全掌握在單一商業平台手中,且缺乏透明的決策流程與有效的申訴機制時,被任意停用的風險已不再是假設,而是真實地懸掛在每位開發者頭上。唯有促使google公開調查結果、明確責任歸屬並提升治理標準,我們才能重建雲生態系統應有的確定性與信任。