NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia

人工智慧 06.15.26

nvidia已正式推出其全新的輕量級多模態ai模型——nemotron 3 nano omnia，並將其整合至自身的ai軟體生態系統中。該模型擁有300億個參數，針對高效處理圖像、影片與音訊等異質媒體資料進行了優化。

實境測試顯示，它能在一小時內完成近10小時長影片的智慧分析，處理速度比即時播放快十倍。與競爭對手gwen 3 omni相比，其影片分析速度快三倍，文件理解速度更是快七倍。

其核心創新在於動態稀疏架構——僅啟用與當前任務相關的參數子集，跳過冗餘運算，因此天生適合整合到基於代理的系統中，而非作為獨立的大型模型使用。

研發團隊強調五項關鍵技術特點：

上下文線性擴展：模型的推理開銷隨輸入長度平穩增長，大幅降低處理長序列時的資源壓力。
情感感知音訊編碼：直接將原始聲波轉換為語義豐富的符號，準確保留語調與情感等非語言資訊，無需額外的asr模組。
區塊級三維卷積：以時空區塊方式處理影片串流，在保持原始畫面比例與畫質的同時，顯著降低gpu負荷。
多任務統一蒸餾：將文本-影像對齊、實例分割與細粒度識別等功能整合至單一編碼器，提升跨模態協作的精確度。
智慧畫格取樣：自動剔除影片中語義重複的畫格，壓縮運算負荷，加速端到端工作流程。

該模型專為高吞吐量場景而設計，如影視製作、智慧安防及工業級資料分析等，所需gpu記憶體為25gb，並支援本地私有部署與主流雲端平台。其採用商業友善的授權協議，使用者經歸因後即可在生產環境中部署。

值得注意的是，nemotron 3 nano omnia在純文字深度推理與程式碼生成等高度邏輯性的任務上表現有限；nvidia建議將此類需求交由專用的語言模型來處理。

OpenAI已正式推出一項新功能：ChatGPT行動應用程式現已整合了Codex的遠端控制功能

openai已正式將codex的遠端控制功能整合至chatgpt的行動版，讓ios與android用戶能夠透過智慧手機即時管理雲端及桌面端的開發任務。從任務啟動、進度追蹤，到作業審核、工作流

06.15.26 0

NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia

nvidia已正式推出其全新的輕量級多模態ai模型——nemotron 3 nano omnia，並將其整合至自身的ai軟體生態系統中。該模型擁有300億個參數，針對高效處理圖像、影片與音訊等異質

06.15.26 0

xAI推出Grok Build——一款專為開發者打造的智慧程式設計助理

xai推出了一款名為grok build的新開發工具，這是一款專為it工程場景打造的智慧協作引擎。與通用型聊天模型不同，它是一種深度整合本地環境的程式設計助理，支援代碼生成、任務分

06.15.26 0

谷歌的新版 Gemini AI 智能助理「Spark」已浮出水面：它支援自動整理電子郵件，並可精確操控瀏覽器

本週稍早，google 正式宣佈 gemini 即將迎來全新介面與升級的自動化功能。最新洩露的線索顯示，這項更新或許標誌著 gemini 向真正「ai 智能助理」邁進的重要一步——隨著一款

06.15.26 0

WRSLT智慧戒指能夠即時且精確地將手語動作轉換為文字

韓國的一個研究團隊研發了一種名為wrslt的透明智慧指環系統，專門為聽障人士設計。它能夠即時捕捉手語動作，並精確地轉換成文字，顯著改善了手語使用者與非手語使用者之間的無障

06.15.26 0

一位前微軟高層尖銳地指出：人工智慧戰略已陷入路徑依賴，重蹈互聯網與行動時代的致命錯誤

科技媒體平台windows latest昨日披露，微軟耗資數十億美元的人工智慧策略正面臨重大挫敗。一位曾在微軟工作12年的前高級主管公開指出，該公司的ai發展路線重蹈了網路與行動時代

06.15.26 0

一個內部的OpenAI團隊在單月內就為API投入了高達1300萬美元，進行密集測試，以在沒有預算限制的情況下不斷挑戰模型能力的極限

奧地利開發者彼得·施泰因貝格近日公開了一個顯示 openai api 使用數據的儀表板，揭示其團隊在30天內產生了130萬美元（約合人民幣890萬元）的費用。這筆開支涵蓋了760萬次api請求

06.15.26 0

BMW的工廠已部署人形機器人，全面啟動全天候自動化作業

5月18日，據外國媒體報導，總部位於美國的機器人新創公司figure ai已正式將其第二代人形機器人figure 02部署於bmw的美國製造工廠。目前，三台代號分別為bob、frank和gary的figur

06.15.26 0

OpenClaw的共同創始人每月投資1300萬美元購買代幣，目前累計持有量已佔流通中6030億枚代幣

據gizevo科技公司——這家奧地利的開發商兼開源專案openclaw的創始人彼得·施泰因貝格爾近日在社群媒體上發布了一張openai api帳單的截圖，引發業界廣泛關注。數據顯示，他的

06.15.26 0

近期研究表明，使用者對人工智慧生成答案所表現出的過度自信，實際上是一種認知偏誤，可能導致判斷失誤與不當的信任

隨著人工智慧技術深入融入日常生活，越來越多的使用者開始仰賴大型模型來提供購物指導、內容推薦，甚至決策支援。然而，一項近期由gizevo發表的報告指出了一種看似矛盾的現象：即

06.15.26 0

通義千問的Qwen37系列預覽版現已開放體驗，並將於阿里雲峰會期間正式揭幕

阿里巴巴最新一代的大型模型——qwen3.7-max preview與qwen3.7-plus preview，已正式於qwen chat與arena ai平台（原名lmarena）上線，開放全球用戶體驗。據官方消息，該系列模型預計

06.15.26 0

Linux創始人林納斯·托瓦茲發出警告：由人工智慧大量產生的重複漏洞報告，正嚴重干擾內核的安全回應流程

在最新內核版本發布之際，linux 創始人林納斯·托瓦茲罕見地對開源協作中人工智能工具的無序使用發出警告。據 gizevo 報導，大量由 ai 大規模生成、內容高度相似的安全報告不

06.15.26 0

谷歌已與黑石集團合作成立人工智慧雲端合資企業，黑石集團將投資50億美元

【gizevo科技新聞】5月19日，權威消息指出，全球領先的另類投資機構黑石集團已正式與alphabet的核心技術引擎google建立戰略合作關係。雙方將共同出資成立一家全新的人工智慧基

06.15.26 0

谷歌推出Gemini Spark：一種由單一句子指令驅動的多任務人工智慧代理

在2026年google i/o開發者大會上，gemini spark正式亮相——這是一款真正意義上的「全天候個人ai協作夥伴」，遠超於單純的問答功能。它能夠理解自然語言指令，自主規劃任務，並同

06.15.26 0

谷歌街景與Genie大型模型合作：基於真實場景打造互動式3D世界

在2026年的google i/o開發者大會上，google正式揭曉了一項突破性的整合：將街景的真實世界資料深度融入其通用世界模型「project genie」，首次實現了「真實地理底圖×生成式空間

06.15.26 0