小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源

小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源


小米今日正式推出 mimo-v2.5-tts 系列與 mimo-v2.5-asr,這是一種專為智能助理時代打造的全棧式語音模型,涵蓋語音辨識與合成這兩項核心功能,實現對語音輸入與輸出的完全靈活語言驅動控制。

其中,mimo-v2.5-tts 系列包含三款模型,目前已在小米的 mimo 開放平台上市,並於限時內免費開放使用。這三款模型具備統一的風格引導式指令遵循、音訊標籤控制以及文本理解能力:標準版預載多種高品質優質語音,並支援對語速、情感與語調進行細緻調控;voicedesign 版則讓用戶僅需一句話即可快速生成全新語音;而 voiceclone 版更可僅憑少量樣本,忠實複製目標語音。使用者如同指導演員般描述所需的情感細節,模型便能穩定呈現——甚至支援劇本層級的導演式、階層化輸入,確保角色聲音始終如一,且每句對白皆可個別掌控。

同時,mimo-v2.5-asr 也已正式開源。該模型在諸多複雜的真實場景中均達成業界領先表現,涵蓋中英雙語情境、中國各地方言(如吳語、粵語、閩南語、四川話等)、代碼切換、重度噪音環境以及多說話者場景。它還能精準轉錄知識密集型內容,例如歌曲歌詞、古典詩詞及專業術語,並原生支援標點符號輸出。評估結果顯示,其在多項指標上均表現出頂尖或極具競爭力的水準。用戶可在小米 mimo api 開放平台與 mimo studio 上探索 tts 系列,開發者則可透過開源程式碼直接使用或進一步客製化 asr 模型。藉由這套完整的端到端語音解決方案,小米正為基於智能助理的互動提供更自然、更可控的語音基礎。

谷歌聲稱,新程式碼中有75%是由人工智慧生成的,工程師們也正轉向審查相關職務

當地時間週三,谷歌透露,目前公司內部撰寫的程式碼中,有四分之三是由人工智慧生成,再經由人類工程師審核。這一比例近年來持續攀升——早在2024年10月時僅約四分之一,而到去年秋

谷歌聲稱,新程式碼中有75%是由人工智慧生成的,工程師們也正轉向審查相關職務

小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源

小米今日正式推出 mimo-v2.5-tts 系列與 mimo-v2.5-asr,這是一種專為智能助理時代打造的全棧式語音模型,涵蓋語音辨識與合成這兩項核心功能,實現對語音輸入與輸出的完全靈活語

小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源

AI音樂席捲蘋果音樂,但其串流次數僅佔不到05%

蘋果音樂的副總裁奧利佛·舒瑟近日透露,儘管目前由人工智慧生成的音樂已佔新上傳曲目相當大的比例,但其實際播放量卻幾乎可以忽略不計。據舒瑟表示,現今提交至蘋果音樂平台的

AI音樂席捲蘋果音樂,但其串流次數僅佔不到05%

聯想聯想萊酷AI MINI PRO迷你電腦上市,搭載英特爾酷睿Ultra 200V系列處理器

近日,聯想旗下樂扣品牌推出了搭載英特爾酷睿ultra 200v系列處理器、代號「lunar lake」的ai mini pro迷你電腦。該新品目前已在各大電商平台開售,預購與秒殺活動也已同步啟動

聯想聯想萊酷AI MINI PRO迷你電腦上市,搭載英特爾酷睿Ultra 200V系列處理器

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

據媒體報導,上海中自興科技有限公司研發了一款名為neu(神經執行單元)的智能原生設計晶片,並計劃於今年第四季開始流片。根據中自興公開的測試數據,在相同的ai推理任務下,neu晶片

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

繼今年二月釋出並開源 vla 大型模型 xiaomi-robotics-0 之後,小米今日宣布正式推出該模型面向真實場域部署的全鏈端到端後訓練工作流程,使這款曾榮登 hugging face 全球 vla

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

騰訊雲近日在其 tokenhub 平台上推出了 deepseek-v4 api 的預覽版,標誌著這項尖端大型模型技術在實際應用上又邁出了重要一步。據報導,deepseek-v4 支援高達一百萬個 token

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

當地時間4月26日,openai執行長山姆·阿爾特曼發表聲明,闡述公司在人工智慧發展方面的核心原則與長期目標。他指出,人工智慧有潛力帶來遠超蒸汽機或電力的變革,顯著提升個人能力

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!

4月27日,谷歌deepmind的執行長戴密斯·哈薩比斯訪問了韓國,並會見了李在明總統。隨後,他與韓國科學技術信息通信部簽署了一份諒解備忘錄,標誌著雙方在人工智慧領域的合作正式啟

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!

阿里巴巴的HappyHorse啟動灰度測試,720p影片生成每秒低至人民幣044元

2026年4月27日,阿里巴巴的視頻生成模型「happyhorse 1.0」正式啟動灰度測試階段。全球專業創作者與企業客戶可透過happyhorse官方網站(www.happyhorse.cn)及阿里雲百煉平台註

阿里巴巴的HappyHorse啟動灰度測試,720p影片生成每秒低至人民幣044元

四家LG電子內部新創公司將獨立運作,專注於人工智慧與機器人領域

4月27日,lg電子宣布,透過其內部孵化計畫「studio341」遴選出的四家內部新創公司將以獨立實體的形式運作。近日,lg電子在首爾麻谷科學園舉辦了studio341成果發表會,並確定了四支

四家LG電子內部新創公司將獨立運作,專注於人工智慧與機器人領域

不再僅是相機模組供應商!舜宇光學將於2025年開始量產割草機器人

近日,舜宇光學科技集團宣布,去年首次開始量產機器人產品。雖然規模仍屬適中,但公司已將其機器人業務確立為下一代成長動力之一。在2025年年度報告中,舜宇光學指出,2025年成功啟

不再僅是相機模組供應商!舜宇光學將於2025年開始量產割草機器人

小米MiMo-V25開源並推出一兆枚代幣的免費計畫

今天清晨,小米科技正式宣布,mimo-v2.5系列模型已全面開源,同時啟動「軌道100兆token計畫」。該系列於4月23日進入公測階段,包含mimo-v2.5-pro與mimo-v2.5兩種版本,均支援100萬tok

小米MiMo-V25開源並推出一兆枚代幣的免費計畫

「嗨,我是KAI」——超維度動力學揭曉全球最自由形態的人形機器人

4月26日,具身智能公司kinetix ai(kai)舉辦了「天賦來臨」發表會,正式揭曉其同名首款全尺寸人形機器人「kai」。此次發表會有別於傳統的產品發布方式:kai並非以常規形式亮相,而是

「嗨,我是KAI」——超維度動力學揭曉全球最自由形態的人形機器人

Android Headlines今日公佈了三星Galaxy Glasses智慧眼鏡的渲染圖這款設備代號「Jinju」,搭載Android XR作業系統,外觀設計令人聯想到Meta的Ray-Ban與Google的Gemini眼鏡——不過它具備一項……

近期,openai 發佈了一款名為「privacy filter」的新模型,旨在協助開發者有效去除文本中的個人識別資訊。該模型擁有 1.5 億個參數,並採用專家混合架構,已在 hugging face 與 gi

Android Headlines今日公佈了三星Galaxy Glasses智慧眼鏡的渲染圖這款設備代號「Jinju」,搭載Android XR作業系統,外觀設計令人聯想到Meta的Ray-Ban與Google的Gemini眼鏡——不過它具備一項……