
自5月17日起,google悄然調整了gemini的資源分配機制,從幾乎難以察覺的付費用戶配額制度,轉變為更細緻、以運算為導向的限流模式。過去,擁有google one ai premium訂閱的用戶幾乎無需擔心使用限制——固定的token數量上限極難觸及。如今,系統引入了雙重時間基準的管控:即時的5小時滾動窗口用於實時使用,以及以自然週為單位的每週上限。在用戶帳戶頁面上也推出了動態計數器,清楚顯示當前已消耗的配額與剩餘額度;一旦耗盡,除了切換至輕量級、低智慧型的模型外,別無他法,只能等待週期重置。
值得注意的是,google並未採用「每條訊息固定配額」的簡單規則,而是根據多項因素動態計算運算消耗,包括模型規模、提示長度以及任務複雜度——高難度推理、長上下文生成,或調用大參數模型,都可能大幅增加每次請求的配額用量,導致部分重度使用者更快達到使用上限。
為因應這項變革,google正重新調整其ai訂閱架構:現有方案紛紛降價以提供更高價值,同時新增了更高階的訂閱層級,明確引導用戶走向「用得越多、等級越高、配額越大」的分層服務邏輯。新的配額不僅涵蓋網頁端互動,還延伸至vertex ai、cli工具鏈,以及第三方整合場景,包括開發者喜愛的anti-gravity等生態工具。