Google已正式推出其下一代開源大型模型Gemma 4,首次實現高性能的即時端裝置推理,並引領邊緣AI部署邁入新紀元

Google已正式推出其下一代開源大型模型Gemma 4,首次實現高性能的即時端裝置推理,並引領邊緣AI部署邁入新紀元

google deepmind 正式發布了其下一代開源大型模型 gemma 4,以「體積小、密度高、泛化強」重新定義了邊緣智能的界限。儘管其參數量仍維持在約 300 億左右,但每個參數的認知能力卻大幅提升,在代碼生成、多語言理解、影片分析等關鍵基準測試中,已達到甚至超越僅 18 個月前頂級閉源模型的實際表現。

這項技術突破的核心在於開創性的 e2b(嵌入到瓶頸)動態卸載架構。該設計透過將全局嵌入表分解為輕量級的層內查表模組,從根本上重塑了傳統變壓器模型的運算模式,大幅降低了矩陣乘法的開銷。實證結果顯示,啟用 e2b 後,一個 50 億參數的模型可將駐留於 gpu 記憶體中的參數壓縮至僅 20 億,而餘下的 30 億則能根據需求動態調度至 cpu 或本地儲存空間。在推理階段,記憶體需求可降至低至 2 gb,實現真正端到端的本地化部署,涵蓋從智慧手機、嵌入式系統到 raspberry pi 等廣泛裝置。

gemma 4 現已深度整合於 android studio 開發環境,支援完全離線、零資料上傳的 ai 協助編碼,兼顧隱私合規與開發效率。該模型繼承並擴展了 gemma 3 的多模態能力,可處理 140 種語言的文字處理與語音辨識,同時還提供針對長度 30 至 60 秒短片的端到端語義分析。deepmind 預測,在未來 12 至 24 個月內,主流旗艦智慧手機將能原生運行性能媲美 gemma 3 pro 的 ai 模型,無需依賴雲端協作,從而推動智慧代理、即時翻譯、個人化助理等應用邁向全面的終端自主化。

OpenAI已重新設計ChatGPT的記憶機制,將運算成本削減了80%,並有效解決了兩個主要難題:資訊過時與事實不準確

6月4日,openai正式推出了chatgpt記憶系統的全面升級版本,代號為「dreaming v3」,這不僅是一次功能上的升級,更是其底層架構的一次重大轉變。新系統直接解決了過去限制記憶能力的

OpenAI已重新設計ChatGPT的記憶機制,將運算成本削減了80%,並有效解決了兩個主要難題:資訊過時與事實不準確

Google已正式推出其下一代開源大型模型Gemma 4,首次實現高性能的即時端裝置推理,並引領邊緣AI部署邁入新紀元

google deepmind 正式發布了其下一代開源大型模型 gemma 4,以「體積小、密度高、泛化強」重新定義了邊緣智能的界限。儘管其參數量仍維持在約 300 億左右,但每個參數的認知能

Google已正式推出其下一代開源大型模型Gemma 4,首次實現高性能的即時端裝置推理,並引領邊緣AI部署邁入新紀元

Meta已正式推出其全球商業AI代理,而WhatsApp也已全面升級為專為企業打造的生產力平台

6月3日,meta正式在全球範圍內推出升級版的人工智慧驅動商業助理——「meta business agent」,並全面整合至whatsapp business平台。這項舉措標誌著whatsapp已從單純的通訊工

Meta已正式推出其全球商業AI代理,而WhatsApp也已全面升級為專為企業打造的生產力平台

高通公司與多家生態系統合作夥伴共同正式啟動「車側AI之爪」計畫,旨在將基於代理的技術深度整合至智慧座艙系統,並加速車載AI應用的部署

在2026年高通汽車科技與合作峰會上,一項旨在擴大車端ai部署的生態系統計畫正式啟動——高通技術公司攜手成麥科技、carlink world、斑馬智行、德賽西威、麥格納科技、中科創

高通公司與多家生態系統合作夥伴共同正式啟動「車側AI之爪」計畫,旨在將基於代理的技術深度整合至智慧座艙系統,並加速車載AI應用的部署

克勞德·科沃克用戶限時優惠:7月5日24:00前,您的每日使用額度將加倍;請注意,每週總額度仍維持不變

近日,a公司宣佈其由人工智慧驅動的協作工具「claude cowork」——專為辦公工作流程優化設計——在促銷期間將暫時把核心效能使用時限加倍,實際上等於將原本5小時的使用上限翻

克勞德·科沃克用戶限時優惠:7月5日24:00前,您的每日使用額度將加倍;請注意,每週總額度仍維持不變

一位菲爾茲獎得主在一小時內使用ChatGPT 55 Pro解決了一道難題,引發學術界對倫理困境的深思

劍橋大學教授、費爾茲獎得主蒂莫西·高爾斯近日在其部落格上披露了一段令人驚異的經歷:他使用尚未公開的chatgpt 5.5 pro,在一小時內解決了一個困擾數學界數十年的組合數學開

一位菲爾茲獎得主在一小時內使用ChatGPT 55 Pro解決了一道難題,引發學術界對倫理困境的深思

黃仁勳對應屆畢業生的寄語:別害怕人工智慧——現在正是開啟職涯的最佳時機

近日,nvidia創辦人兼執行長黃仁勳出席了卡內基美隆大學2026屆畢業典禮並發表演講,鼓勵今年的畢業生無需害怕人工智慧。他強調,ai將為全人類帶來正面影響,而現在正是展開職涯的

黃仁勳對應屆畢業生的寄語:別害怕人工智慧——現在正是開啟職涯的最佳時機

xAI在更名為SpaceX AI後的首秀:Grok構建程式應用程式意外洩露

埃隆·馬斯克的ai初創公司xai近日正式更名為spacexai,隨後不久便傳出一項重大消息:該公司正準備推出一款名為grok build的桌面編程應用程式。這項爆料源自grok網頁介面的一次

xAI在更名為SpaceX AI後的首秀:Grok構建程式應用程式意外洩露

日本已成立跨部會工作小組,以加速人工智能與半導體等戰略領域的人才培育

日本政府近日決定成立一個跨部會專案小組,專門培育人工智慧、半導體、量子技術、造船及國防製造等戰略產業的人才。東京正協調設立一個名為「再技能化與人才發展推進委員會

日本已成立跨部會工作小組,以加速人工智能與半導體等戰略領域的人才培育

Mozilla推出開源企業級人工智慧客戶端Thunderbolt,著重資料主權與全堆疊控制

近日,mozilla基金會的子公司mzla technologies推出了thunderbolt,這是一款定位為主權ai解決方案的開源企業級ai客戶端。它專為自託管部署而設計,使組織能夠完全掌控其資料、模

Mozilla推出開源企業級人工智慧客戶端Thunderbolt,著重資料主權與全堆疊控制

英特爾推出Core i7-245HX處理器:首款非超級低功耗的Arrow Lake-HX系列

近期,英特爾悄然推出了數款新處理器——其中一些因廠商新款電腦型號的規格洩露而早已為公眾所知,另一些則是透過英特爾官方網站的更新被發現。這些新品與前代產品的規格大同

英特爾推出Core i7-245HX處理器:首款非超級低功耗的Arrow Lake-HX系列

豐田的CUE7機器人展現了其籃球技巧

豐田汽車公司推出了新款籃球機器人「cue7」。這款機器人在日本的一場籃球賽中首次亮相,並在比賽中成功投進一球。據日經亞洲報導,這款機器人身高219公分,以兩個輪子移動,手臂上

豐田的CUE7機器人展現了其籃球技巧

一鍵啟用純淨音質:三星Galaxy S26系列開啟升級版「音頻消除」體驗

「音頻消除」功能內建於三星galaxy裝置中,[1] 能智慧地去除不必要的背景噪音,同時強化核心音訊,帶來身臨其境的影音體驗。自首次登場於三星galaxy s25系列以來,此功能經過多代

一鍵啟用純淨音質:三星Galaxy S26系列開啟升級版「音頻消除」體驗

Anthropic執行長:人工智慧發展永無止境;未來五年內,它可能取代一半的基層白領職位

人工智慧公司anthropic的執行長達里奧·阿莫迪近日在採訪中表示,人工智慧的發展仍有極大的空間——就像彩虹一樣,似乎沒有盡頭——而運算能力距離發揮其全部潛力還有很長一段

Anthropic執行長:人工智慧發展永無止境;未來五年內,它可能取代一半的基層白領職位

報導指出,三星Galaxy Z Fold 3已在美國停產

三星的三折式智慧手機galaxy z fold3,已正式宣告結束其產品生命週期。該機最初僅在韓國以限量方式上市,短暫上架後便已停售;然而,在美國卻持續販售一段時間;4月10日,三星進行了最

報導指出,三星Galaxy Z Fold 3已在美國停產