谷歌推出適用於Gemma 4的多令牌預測技術,將AI推論速度提升300%

谷歌推出適用於Gemma 4的多令牌預測技術,將AI推論速度提升300%


據外國媒體報導,google 最近正式公開了用於 gemma 4 系列模型的多-token 預測起草器。這項技術突破利用了一種推測式解碼架構,將模型推理速度提升至多三倍,同時不影響輸出品質或邏輯推理能力。作為全球最受關注的開源模型之一,gemma 4 在推出後不久便已累計超過六千萬次下載;而此次更新的核心目標正是解決大型語言模型長期以來的推理瓶頸,從而進一步最大化運算資源的使用效率。

傳統語言模型的推理往往受限於 gpu 記憶體頻寬:在生成文字時,處理器必須花費大量時間將數十億個參數從 gpu 記憶體傳輸到運算單元,導致大部分硬體資源處於閒置狀態,進而造成明顯的回應延遲。google 新推出的推測式解碼技術採用了「主—從」協調模式:系統將像 gemma 4 31b 這樣的重量級目標模型與輕量級 mtp 草稿器配對。草稿器利用閒置的運算能力主動預測多個未來可能出現的 token,隨後由主模型並行驗證這些預測。一旦預測結果相符,模型便可直接在一次運算中確認整個序列,大幅縮短文字生成時間。

根據官方基準測試數據,在本地裝置上的加速效果尤其顯著。在 apple silicon 芯片上,gemma 4 26b 模型的本地推理速度提升了約 2.2 倍。這意味著開發者現在可以在個人電腦或標準消費級 gpu 上順暢運行複雜的離線程式設計助理或智慧代理工作流程;同時,推理效率的提升也顯著降低了邊緣裝置的功耗。這項技術更新主要針對即時聊天機器人、自動化程式設計工具等低延遲應用場景。透過 mtp 草稿器,google 證明了即使在資源受限的硬體環境下,開發者也能部署最先進的語言模型,無需在回應速度與運算精確度之間做出妥協。隨著推理成本與門檻持續下降,gemma 4 正將 ai 從雲端帶到更廣泛的個人運算終端。

OpenAI為ChatGPT推出「可信聯絡人」功能,以降低人工智慧對話中自傷的風險

近期,openai為chatgpt推出了一項名為「信任聯絡人」的新功能,旨在當用戶的對話中出現與自傷相關的內容時,主動介入並提供人際支持。這項功能主要針對成人用戶:一旦系統偵測到潛

OpenAI為ChatGPT推出「可信聯絡人」功能,以降低人工智慧對話中自傷的風險

谷歌推出適用於Gemma 4的多令牌預測技術,將AI推論速度提升300%

據外國媒體報導,google 最近正式公開了用於 gemma 4 系列模型的多-token 預測起草器。這項技術突破利用了一種推測式解碼架構,將模型推理速度提升至多三倍,同時不影響輸出品質

谷歌推出適用於Gemma 4的多令牌預測技術,將AI推論速度提升300%

向外部依賴說再見!馬斯克與英特爾攜手,投資550億美元興建晶片工廠

近日,根據德州格賴姆斯縣發布的公聽會通知,由太空探索技術公司(spacex)主導的半導體專案被命名為「terafab」。文件顯示,該專案的第一階段預計至少需要550億美元的投資,總支出則

向外部依賴說再見!馬斯克與英特爾攜手,投資550億美元興建晶片工廠

OpenAI的內部晶片研發面臨障礙,因博通要求微軟採購其40%的產能

據外媒最新報導,openai 與博通之間的 ai 芯片合作已陷入僵局。內部備忘錄及兩位熟悉談判情況的消息人士透露,雙方目前正討論一項協議:由博通提供資金,以推進第一階段的晶片生產

OpenAI的內部晶片研發面臨障礙,因博通要求微軟採購其40%的產能

ChatGPT 和 Claude 的辦公室外掛程式已正式發佈,並相容於 Excel 等辦公軟體

近期,openai 的 chatgpt 與 anthropic 的 claude 已被整合至辦公軟體環境中,包括 excel、google 表格以及 microsoft 365。這一發展重塑了試算表處理與資料分析的方式:使用者

ChatGPT 和 Claude 的辦公室外掛程式已正式發佈,並相容於 Excel 等辦公軟體

Zeroth的M1成為全球首款與OpenClaw相整合的人形機器人

中國蘇州樂享智能科技有限公司正式宣佈,旗下具身智能品牌「zeroth元典」旗下的m1人形機器人,已成為全球首款可量產、並整合騰訊「openclaw」的機器人,這標誌著ai代理在雲端、

Zeroth的M1成為全球首款與OpenClaw相整合的人形機器人

OpenAI推出適用於Chrome擴充功能的Codex,以促進智慧型瀏覽器協作

openai 最近正式推出了一款名為「codex for chrome」的瀏覽器擴展程式,為桌面版 chrome 瀏覽器用戶提供更直接的 codex 智能支援。該擴展程式目前已全面兼容 macos 與 windo

OpenAI推出適用於Chrome擴充功能的Codex,以促進智慧型瀏覽器協作

CarPlay新增成員:Grok AI正式整合至車內語音互動系統

繼 chatgpt 和 perplexity 之後,蘋果的 carplay 生態系統又迎來了一位重量級新成員。科技媒體 9to5mac 昨日(5月8日)報導,埃隆·馬斯克旗下的 xai——現已更名為 spacex ai——

CarPlay新增成員:Grok AI正式整合至車內語音互動系統

OpenAI推出GPT-55-Cyber預覽版,這是一款專門用於網路安全的模型

週四,openai 宣布向經審核的安全團隊有限釋出 gpt-5.5-cyber 預覽版。這是一種專門針對網路安全的最新模型版本,即 gpt-5.5。該公司強調,此變體並非用於增強攻擊或防禦性的網路

OpenAI推出GPT-55-Cyber預覽版,這是一款專門用於網路安全的模型

谷歌為安卓版推出Snapseed 40,新增相機與底片濾鏡

5月9日,谷歌在play商店發布了照片編輯應用程式snapseed 4.0,為安卓用戶推出snapseed相機功能,並可使用底片風格的濾鏡拍攝照片。此次更新包含:重新設計的使用者介面——編輯速度

谷歌為安卓版推出Snapseed 40,新增相機與底片濾鏡

實驗發現克勞德曾「勒索」虛構的高層主管,安瑟羅普將此歸因於網路文本的影響

在去年進行的一項研究中,anthropic 發現其人工智慧模型 claude sonnet 3.6 在虛構情境下表現出「勒索」行為。研究人員設立了一家名為「summit bridge」的虛構公司,並委託 cl

實驗發現克勞德曾「勒索」虛構的高層主管,安瑟羅普將此歸因於網路文本的影響

機器人僧侶首次參與佛教儀式

南韓首次舉行了由人形機器人參與的佛教儀式。這款名為「gabi」的機器人在首爾 jogyesa 寺廟的佛誕慶典前夕,與僧侶們一同參與了儀式。這款高130公分的機器人身著傳統僧袍,由

機器人僧侶首次參與佛教儀式

Google 地圖的 CarPlay 版本將整合 Gemini AI,讓用戶可以透過語音進行互動!

根據macrumors在谷歌地圖應用程式中發現的代碼,谷歌地圖的carplay版本可能即將支援gemini ai。這項整合將讓carplay用戶透過gemini獲取詳細的導航路線與相關資訊。應用程式

Google 地圖的 CarPlay 版本將整合 Gemini AI,讓用戶可以透過語音進行互動!

OpenAI正進行一項規模高達40億美元的果敢投資,以成立一家新公司,加速企業級人工智慧的部署

當地時間週一,openai 宣布成立一家名為「openai 部署公司」的新公司,初始投資超過 40 億美元(約合人民幣 272 億元),旨在協助各類組織建構並部署人工智慧系統。同時,openai 還將收

OpenAI正進行一項規模高達40億美元的果敢投資,以成立一家新公司,加速企業級人工智慧的部署

OpenAI推出Daybreak專案,將自身定位為Anthropic旗下Glasswing的競爭對手

openai已推出daybreak專案,旨在與anthropic的glasswing計畫及mythos ai模型競爭。據外媒報導,openai今日正式揭曉daybreak,目標是對抗anthropic的glasswing計畫與mythos ai模

OpenAI推出Daybreak專案,將自身定位為Anthropic旗下Glasswing的競爭對手