NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia

NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia


nvidia已正式推出其全新的輕量級多模態ai模型——nemotron 3 nano omnia,並將其整合至自身的ai軟體生態系統中。該模型擁有300億個參數,針對高效處理圖像、影片與音訊等異質媒體資料進行了優化。

實境測試顯示,它能在一小時內完成近10小時長影片的智慧分析,處理速度比即時播放快十倍。與競爭對手gwen 3 omni相比,其影片分析速度快三倍,文件理解速度更是快七倍。

其核心創新在於動態稀疏架構——僅啟用與當前任務相關的參數子集,跳過冗餘運算,因此天生適合整合到基於代理的系統中,而非作為獨立的大型模型使用。

研發團隊強調五項關鍵技術特點:

上下文線性擴展:模型的推理開銷隨輸入長度平穩增長,大幅降低處理長序列時的資源壓力。
情感感知音訊編碼:直接將原始聲波轉換為語義豐富的符號,準確保留語調與情感等非語言資訊,無需額外的asr模組。
區塊級三維卷積:以時空區塊方式處理影片串流,在保持原始畫面比例與畫質的同時,顯著降低gpu負荷。
多任務統一蒸餾:將文本-影像對齊、實例分割與細粒度識別等功能整合至單一編碼器,提升跨模態協作的精確度。
智慧畫格取樣:自動剔除影片中語義重複的畫格,壓縮運算負荷,加速端到端工作流程。

該模型專為高吞吐量場景而設計,如影視製作、智慧安防及工業級資料分析等,所需gpu記憶體為25gb,並支援本地私有部署與主流雲端平台。其採用商業友善的授權協議,使用者經歸因後即可在生產環境中部署。

值得注意的是,nemotron 3 nano omnia在純文字深度推理與程式碼生成等高度邏輯性的任務上表現有限;nvidia建議將此類需求交由專用的語言模型來處理。

OpenAI已正式推出一項新功能:ChatGPT行動應用程式現已整合了Codex的遠端控制功能

openai已正式將codex的遠端控制功能整合至chatgpt的行動版,讓ios與android用戶能夠透過智慧手機即時管理雲端及桌面端的開發任務。從任務啟動、進度追蹤,到作業審核、工作流

OpenAI已正式推出一項新功能:ChatGPT行動應用程式現已整合了Codex的遠端控制功能

NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia

nvidia已正式推出其全新的輕量級多模態ai模型——nemotron 3 nano omnia,並將其整合至自身的ai軟體生態系統中。該模型擁有300億個參數,針對高效處理圖像、影片與音訊等異質

NVIDIA推出了一款全新的輕量級AI模型——Nemotron 3 Nano Omnia

xAI推出Grok Build——一款專為開發者打造的智慧程式設計助理

xai推出了一款名為grok build的新開發工具,這是一款專為it工程場景打造的智慧協作引擎。與通用型聊天模型不同,它是一種深度整合本地環境的程式設計助理,支援代碼生成、任務分

xAI推出Grok Build——一款專為開發者打造的智慧程式設計助理

谷歌的新版 Gemini AI 智能助理「Spark」已浮出水面:它支援自動整理電子郵件,並可精確操控瀏覽器

本週稍早,google 正式宣佈 gemini 即將迎來全新介面與升級的自動化功能。最新洩露的線索顯示,這項更新或許標誌著 gemini 向真正「ai 智能助理」邁進的重要一步——隨著一款

谷歌的新版 Gemini AI 智能助理「Spark」已浮出水面:它支援自動整理電子郵件,並可精確操控瀏覽器

WRSLT智慧戒指能夠即時且精確地將手語動作轉換為文字

韓國的一個研究團隊研發了一種名為wrslt的透明智慧指環系統,專門為聽障人士設計。它能夠即時捕捉手語動作,並精確地轉換成文字,顯著改善了手語使用者與非手語使用者之間的無障

WRSLT智慧戒指能夠即時且精確地將手語動作轉換為文字

一位前微軟高層尖銳地指出:人工智慧戰略已陷入路徑依賴,重蹈互聯網與行動時代的致命錯誤

科技媒體平台windows latest昨日披露,微軟耗資數十億美元的人工智慧策略正面臨重大挫敗。一位曾在微軟工作12年的前高級主管公開指出,該公司的ai發展路線重蹈了網路與行動時代

一位前微軟高層尖銳地指出:人工智慧戰略已陷入路徑依賴,重蹈互聯網與行動時代的致命錯誤

一個內部的OpenAI團隊在單月內就為API投入了高達1300萬美元,進行密集測試,以在沒有預算限制的情況下不斷挑戰模型能力的極限

奧地利開發者彼得·施泰因貝格近日公開了一個顯示 openai api 使用數據的儀表板,揭示其團隊在30天內產生了130萬美元(約合人民幣890萬元)的費用。這筆開支涵蓋了760萬次api請求

一個內部的OpenAI團隊在單月內就為API投入了高達1300萬美元,進行密集測試,以在沒有預算限制的情況下不斷挑戰模型能力的極限

BMW的工廠已部署人形機器人,全面啟動全天候自動化作業

5月18日,據外國媒體報導,總部位於美國的機器人新創公司figure ai已正式將其第二代人形機器人figure 02部署於bmw的美國製造工廠。目前,三台代號分別為bob、frank和gary的figur

BMW的工廠已部署人形機器人,全面啟動全天候自動化作業

OpenClaw的共同創始人每月投資1300萬美元購買代幣,目前累計持有量已佔流通中6030億枚代幣

據gizevo科技公司——這家奧地利的開發商兼開源專案openclaw的創始人彼得·施泰因貝格爾近日在社群媒體上發布了一張openai api帳單的截圖,引發業界廣泛關注。數據顯示,他的

OpenClaw的共同創始人每月投資1300萬美元購買代幣,目前累計持有量已佔流通中6030億枚代幣

近期研究表明,使用者對人工智慧生成答案所表現出的過度自信,實際上是一種認知偏誤,可能導致判斷失誤與不當的信任

隨著人工智慧技術深入融入日常生活,越來越多的使用者開始仰賴大型模型來提供購物指導、內容推薦,甚至決策支援。然而,一項近期由gizevo發表的報告指出了一種看似矛盾的現象:即

近期研究表明,使用者對人工智慧生成答案所表現出的過度自信,實際上是一種認知偏誤,可能導致判斷失誤與不當的信任

通義千問的Qwen37系列預覽版現已開放體驗,並將於阿里雲峰會期間正式揭幕

阿里巴巴最新一代的大型模型——qwen3.7-max preview與qwen3.7-plus preview,已正式於qwen chat與arena ai平台(原名lmarena)上線,開放全球用戶體驗。據官方消息,該系列模型預計

通義千問的Qwen37系列預覽版現已開放體驗,並將於阿里雲峰會期間正式揭幕

Linux創始人林納斯·托瓦茲發出警告:由人工智慧大量產生的重複漏洞報告,正嚴重干擾內核的安全回應流程

在最新內核版本發布之際,linux 創始人林納斯·托瓦茲罕見地對開源協作中人工智能工具的無序使用發出警告。據 gizevo 報導,大量由 ai 大規模生成、內容高度相似的安全報告不

Linux創始人林納斯·托瓦茲發出警告:由人工智慧大量產生的重複漏洞報告,正嚴重干擾內核的安全回應流程

谷歌已與黑石集團合作成立人工智慧雲端合資企業,黑石集團將投資50億美元

【gizevo科技新聞】5月19日,權威消息指出,全球領先的另類投資機構黑石集團已正式與alphabet的核心技術引擎google建立戰略合作關係。雙方將共同出資成立一家全新的人工智慧基

谷歌已與黑石集團合作成立人工智慧雲端合資企業,黑石集團將投資50億美元

谷歌推出Gemini Spark:一種由單一句子指令驅動的多任務人工智慧代理

在2026年google i/o開發者大會上,gemini spark正式亮相——這是一款真正意義上的「全天候個人ai協作夥伴」,遠超於單純的問答功能。它能夠理解自然語言指令,自主規劃任務,並同

谷歌推出Gemini Spark:一種由單一句子指令驅動的多任務人工智慧代理

谷歌街景與Genie大型模型合作:基於真實場景打造互動式3D世界

在2026年的google i/o開發者大會上,google正式揭曉了一項突破性的整合:將街景的真實世界資料深度融入其通用世界模型「project genie」,首次實現了「真實地理底圖×生成式空間

谷歌街景與Genie大型模型合作:基於真實場景打造互動式3D世界