小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞


繼今年二月釋出並開源 vla 大型模型 xiaomi-robotics-0 之後,小米今日宣布正式推出該模型面向真實場域部署的全鏈端到端後訓練工作流程,使這款曾榮登 hugging face 全球 vla 模型下載排行榜第六名的模型,更進一步邁向成為「即插即用」的生產力工具。

據小米表示,透過運用預訓練基礎模型,並在實體硬體上進行僅需 20 小時的任務專屬微調,團隊便讓機器人成功掌握「將耳塞收納至充電盒中」這項極具挑戰性的任務,且能順暢地連續執行多項收納動作。看似簡單的任務,其實充滿難題:耳塞與儲物槽之間的間隙極為狹小,需要亞毫米級的空間感知精準度才能精確對位;同時,耳塞與充電盒的表面粗糙度低至 ra 0.03 µm,接觸時容易發生位移,因此必須快速修正運動偏差,以避免組裝失敗。

藉由公開完整的後訓練工作流程,小米展現了 vla 模型在精密操作任務上的快速學習能力。公司指出,這意味著開發者與產業用戶能夠基於開源基礎模型,以更少的資料與運算資源,進行高效、針對特定場景的微調。也因此,xiaomi-robotics-0 得以加速從通用型預訓練模型演進為能解決真實世界問題的專用機器人智慧代理。

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

據媒體報導,上海中自興科技有限公司研發了一款名為neu(神經執行單元)的智能原生設計晶片,並計劃於今年第四季開始流片。根據中自興公開的測試數據,在相同的ai推理任務下,neu晶片

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

繼今年二月釋出並開源 vla 大型模型 xiaomi-robotics-0 之後,小米今日宣布正式推出該模型面向真實場域部署的全鏈端到端後訓練工作流程,使這款曾榮登 hugging face 全球 vla

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

騰訊雲近日在其 tokenhub 平台上推出了 deepseek-v4 api 的預覽版,標誌著這項尖端大型模型技術在實際應用上又邁出了重要一步。據報導,deepseek-v4 支援高達一百萬個 token

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

當地時間4月26日,openai執行長山姆·阿爾特曼發表聲明,闡述公司在人工智慧發展方面的核心原則與長期目標。他指出,人工智慧有潛力帶來遠超蒸汽機或電力的變革,顯著提升個人能力

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!

4月27日,谷歌deepmind的執行長戴密斯·哈薩比斯訪問了韓國,並會見了李在明總統。隨後,他與韓國科學技術信息通信部簽署了一份諒解備忘錄,標誌著雙方在人工智慧領域的合作正式啟

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!

阿里巴巴的HappyHorse啟動灰度測試,720p影片生成每秒低至人民幣044元

2026年4月27日,阿里巴巴的視頻生成模型「happyhorse 1.0」正式啟動灰度測試階段。全球專業創作者與企業客戶可透過happyhorse官方網站(www.happyhorse.cn)及阿里雲百煉平台註

阿里巴巴的HappyHorse啟動灰度測試,720p影片生成每秒低至人民幣044元

四家LG電子內部新創公司將獨立運作,專注於人工智慧與機器人領域

4月27日,lg電子宣布,透過其內部孵化計畫「studio341」遴選出的四家內部新創公司將以獨立實體的形式運作。近日,lg電子在首爾麻谷科學園舉辦了studio341成果發表會,並確定了四支

四家LG電子內部新創公司將獨立運作,專注於人工智慧與機器人領域

不再僅是相機模組供應商!舜宇光學將於2025年開始量產割草機器人

近日,舜宇光學科技集團宣布,去年首次開始量產機器人產品。雖然規模仍屬適中,但公司已將其機器人業務確立為下一代成長動力之一。在2025年年度報告中,舜宇光學指出,2025年成功啟

不再僅是相機模組供應商!舜宇光學將於2025年開始量產割草機器人

小米MiMo-V25開源並推出一兆枚代幣的免費計畫

今天清晨,小米科技正式宣布,mimo-v2.5系列模型已全面開源,同時啟動「軌道100兆token計畫」。該系列於4月23日進入公測階段,包含mimo-v2.5-pro與mimo-v2.5兩種版本,均支援100萬tok

小米MiMo-V25開源並推出一兆枚代幣的免費計畫

「嗨,我是KAI」——超維度動力學揭曉全球最自由形態的人形機器人

4月26日,具身智能公司kinetix ai(kai)舉辦了「天賦來臨」發表會,正式揭曉其同名首款全尺寸人形機器人「kai」。此次發表會有別於傳統的產品發布方式:kai並非以常規形式亮相,而是

「嗨,我是KAI」——超維度動力學揭曉全球最自由形態的人形機器人

Android Headlines今日公佈了三星Galaxy Glasses智慧眼鏡的渲染圖這款設備代號「Jinju」,搭載Android XR作業系統,外觀設計令人聯想到Meta的Ray-Ban與Google的Gemini眼鏡——不過它具備一項……

近期,openai 發佈了一款名為「privacy filter」的新模型,旨在協助開發者有效去除文本中的個人識別資訊。該模型擁有 1.5 億個參數,並採用專家混合架構,已在 hugging face 與 gi

Android Headlines今日公佈了三星Galaxy Glasses智慧眼鏡的渲染圖這款設備代號「Jinju」,搭載Android XR作業系統,外觀設計令人聯想到Meta的Ray-Ban與Google的Gemini眼鏡——不過它具備一項……

三星Galaxy眼鏡設計曝光:無螢幕設計,可能於七月亮相

android頭條今日公開了三星galaxy glasses智慧眼鏡的渲染圖。這款設備代號「jinju」,運行android xr作業系統,外觀風格與meta的ray-ban及google的gemini眼鏡相似,但採用無螢幕

三星Galaxy眼鏡設計曝光:無螢幕設計,可能於七月亮相

Adobe Firefly AI助理推出公開測試版,實現跨應用程式協調,加速創意執行

adobe 今日宣布,firefly ai 助理已正式進入公開測試階段,並即日起向全球用戶逐步推出。首批符合資格的用戶群體包括 creative cloud pro 訂閱者,以及 firefly pro、pro plus 和

Adobe Firefly AI助理推出公開測試版,實現跨應用程式協調,加速創意執行

NVIDIA推出Nemotron 3 Nano Omni,這是一種多模式模型,其吞吐量最高可提升92倍

當地時間4月28日,nvidia正式發布了nemotron 3 nano omni,這是一種開源的多模態推理模型,旨在為企業級ai代理提供一體化的基礎模型。該模型基於具備300億參數的a3b專家混合架構,

NVIDIA推出Nemotron 3 Nano Omni,這是一種多模式模型,其吞吐量最高可提升92倍

據傳Kimi K3將於第三季度亮相,擁有25兆參數,旨在突破中國大型模型的性能天花板

中國大型ai模型之間的競爭正進入白熱化階段。繼「通義千問」v4引發市場熱議後,月之暗面推出的下一代模型「kimi k3」也公布了最新進展。據相關消息稱,kimi k3預計將於今年第

據傳Kimi K3將於第三季度亮相,擁有25兆參數,旨在突破中國大型模型的性能天花板