Stability AI正式發布Audio 30:一款全新的大規模音訊模型,支援生成長達六分鐘的高品質音樂

Stability AI正式發布Audio 30:一款全新的大規模音訊模型,支援生成長達六分鐘的高品質音樂


stability ai 正式發布了 stability audio 3.0 系列的音頻生成模型,這標誌著人工智慧音樂生成邁向新的里程碑——其旗艦版支援輸出長度超過六分鐘、結構完整且風格一致的專業級作品。

新推出的模型家族包含四種不同的架構:xfs 輕量版與標準小版,分別擁有 4,590 萬個參數;中型版則擁有 14 億個參數;而旗艦大型版更擁有 27 億個參數。其中,兩個小型模型專為邊緣裝置部署而優化,可在本地實時生成音效及兩分鐘以內的短篇音樂作品。同時,中型與大型模型在時間建模與結構一致性方面實現突破,能夠生成長達 6 分鐘 20 秒的連續作品,具備各樂段間自然流暢的過渡、穩定的調性以及強烈的主題連貫性——最大時長較上一代 stability audio 2.0 提升逾一倍。

開源策略持續重視社群驅動的創新:小型 sfx 模型,以及小型與中型版本,已全面公開其權重與原始碼,供用戶免費下載、微調並商用。然而,最強大的大型模型仍無法進行本地部署,僅能透過 api 接口與雲端託管服務使用;企業若年營收超過百萬美元,則需簽署商業授權協議後方可獲取使用權。

在資料合規方面,stability ai 已完成關鍵基礎建設——與華納音樂集團及環球音樂集團建立戰略合作關係,確保 stability audio 3.0 所使用的訓練資料均來自合法授權的音樂庫,從源頭降低版權風險。

同時,公司正加速拓展專業音訊生態系統,邀請前環球音訊與芬達公司首席數位官伊森·卡普蘭加入,領導開發一套專為專業音樂人量身打造的新世代 ai 驅動創作工具套件。

谷歌推出 Gemini 35 Flash:推理速度比 GPT-45 快四倍

在2026年谷歌i/o開發者大會上,執行長桑達爾·皮查伊正式發表了gemini 3.5 flash——一款基於「超快推理」與「協作智慧」打造的新一代輕量級大型模型。這不僅僅是速度的提升

谷歌推出 Gemini 35 Flash:推理速度比 GPT-45 快四倍

Stability AI正式發布Audio 30:一款全新的大規模音訊模型,支援生成長達六分鐘的高品質音樂

stability ai 正式發布了 stability audio 3.0 系列的音頻生成模型,這標誌著人工智慧音樂生成邁向新的里程碑——其旗艦版支援輸出長度超過六分鐘、結構完整且風格一致的專

Stability AI正式發布Audio 30:一款全新的大規模音訊模型,支援生成長達六分鐘的高品質音樂

騰訊已正式推出其全新作業系統級人工智慧助理「Marvis」,該助理具備跨裝置協同控制功能,並內建本地化隱私保護機制

5月20日,騰訊正式推出全新作業系統級人工智慧助理——marvis(馬維斯),並同步開放官方網站(marvis.qq.com)供下載。用戶無需任何門檻或邀請碼,即可立即安裝使用。與傳統對話式人工

騰訊已正式推出其全新作業系統級人工智慧助理「Marvis」,該助理具備跨裝置協同控制功能,並內建本地化隱私保護機制

DeepSeek已正式成立一支全新的技術團隊「Harness」,專注於為開發者研發代碼智能代理,直接與Anthropic的Claude Code展開競爭

deepseek正加速布局代理技術這一新興領域,並正式成立了一支代號為「harness」的專屬團隊,專注於為開發者打造代碼智能代理,力爭與anthropic的claude code一較高下。據deepseek

DeepSeek已正式成立一支全新的技術團隊「Harness」,專注於為開發者研發代碼智能代理,直接與Anthropic的Claude Code展開競爭

YouTube揭曉其人工智慧策略的下一階段:在提升對話式搜尋體驗的同時,也升級其檢測與防範深偽內容的能力

在2026年的google i/o大會上,youtube揭曉了其迄今為止最具戰略意義的ai整合——它並非作為內容取代引擎,而是作為一種深植於發現、創作與信任之中的智慧基礎設施。透過gemini

YouTube揭曉其人工智慧策略的下一階段:在提升對話式搜尋體驗的同時,也升級其檢測與防範深偽內容的能力

新加坡與谷歌及OpenAI簽署人工智慧合作協議,以加速區域樞紐的發展

新加坡已正式躋身全球人工智慧策略的領頭羊,近期與谷歌及openai締結深度戰略合作關係,以加速人工智慧技術在公共治理、智慧醫療、數位教育及產業轉型等領域的大規模應用。這些

新加坡與谷歌及OpenAI簽署人工智慧合作協議,以加速區域樞紐的發展

Cursor已推出其全新、由內部研發的模型——Composer 25,以卓越的效能與顯著的成本優勢,重新塑造AI程式設計工具的格局

隨著人工智慧程式設計工具市場加速洗牌,cursor 正式推出其自主研發的大型模型 composer 2.5,徹底擺脫對外部閉源模型——尤其是 claude 系列——的技術依賴,並朝向從「整合者

Cursor已推出其全新、由內部研發的模型——Composer 25,以卓越的效能與顯著的成本優勢,重新塑造AI程式設計工具的格局

由OpenAI開發的一種人工智慧工具,已成功解決了一個持續八十年未解的經典數學問題

openai近日宣布了一項突破性的進展:其自主研發的人工智慧系統首次解決了數學家保羅·艾狄胥於1946年提出的經典「單位距離問題」。這項長期以來懸而未決的組合幾何學難題,一

由OpenAI開發的一種人工智慧工具,已成功解決了一個持續八十年未解的經典數學問題

DeepSeek API 全面升級:回應輸出速度顯著提升,服務能力大幅增強,並已將併發處理上限優化至 500 個連線

deepseek近期已完成全棧效能升級,大幅提升了回應速度與服務能力:預設並發處理量已提升至500筆即時請求,顯著降低端到端延遲,並大幅提升服務穩定性與可用性。針對高負載的業務場

DeepSeek API 全面升級:回應輸出速度顯著提升,服務能力大幅增強,並已將併發處理上限優化至 500 個連線

OpenAI已正式推出ChatGPT for PowerPoint外掛程式,並在全球範圍內免費提供給用戶使用

近期,openai悄然推出了「chatgpt for powerpoint」(測試版)外掛程式,這標誌著大型模型功能首次以原生方式深度整合至powerpoint中。這也意味著,由ai驅動的辦公工作已從「輔助工

OpenAI已正式推出ChatGPT for PowerPoint外掛程式,並在全球範圍內免費提供給用戶使用

歐洲中央銀行召開了一場緊急的閉門會議,警告Anthropic的人工智慧模型可能被濫用於金融攻擊,並呼籲歐元區各銀行立即加強其人工智慧安全措施與網路韌性

歐洲中央銀行緊急召開了一場閉門會議,邀請了歐元區內的111家大型銀行參加,重點討論由anthropic新推出的ai模型「claude mythos preview」所帶來的系統性網路安全風險。儘管目

歐洲中央銀行召開了一場緊急的閉門會議,警告Anthropic的人工智慧模型可能被濫用於金融攻擊,並呼籲歐元區各銀行立即加強其人工智慧安全措施與網路韌性

馬斯克已正式證實,xAI 最新的大型語言模型「Grok-3」(代號 V9-Medium)已順利完成訓練,其參數量超過 15 兆,這標誌著超大型語言模型領域邁出了關鍵一步

昨日,伊隆·馬斯克正式證實,xai 的全新旗艦大型模型 grok v9-medium 已完成基礎訓練,並正式進入關鍵的監督式微調階段。該模型擁有 1.5 兆個參數,規模是目前主線 v8-small 版本

馬斯克已正式證實,xAI 最新的大型語言模型「Grok-3」(代號 V9-Medium)已順利完成訓練,其參數量超過 15 兆,這標誌著超大型語言模型領域邁出了關鍵一步

DeepSeek-V4-Pro已正式進行大幅降價,降幅高達75%,瞬間穩坐全球AI模型成本效益的領導地位

近日,中國領先的人工智慧公司深海鯊魚正式公佈了其深海鯊魚-v4-pro大型模型的全新api定價策略——將原定於5月31日到期的25%限時折扣延長為永久性定價結構,使整體成本實際上降

DeepSeek-V4-Pro已正式進行大幅降價,降幅高達75%,瞬間穩坐全球AI模型成本效益的領導地位

開發人員已在程式碼倉庫和 API 日誌中發現 GPT-56 的早期線索,其支援的上下文長度高達 1,500 萬個 token,預計將於下月正式亮相

就在 gpt-5.5 正式發布後僅僅三週,數位開發者便在 openai 的 codex 服務後端日誌中意外發現了一款尚未公開的新模型——gpt-5.6,其內部代號為「iris-alpha」。這一驚人發現迅

開發人員已在程式碼倉庫和 API 日誌中發現 GPT-56 的早期線索,其支援的上下文長度高達 1,500 萬個 token,預計將於下月正式亮相

字節跳動已針對核心人工智慧人才推出基於股權的激勵計畫,透過「豆包」平台向其人工智慧團隊開放內部股票認購,認購價格為每股13美元,旨在加強長期利益連結與

字節跳動正針對其ai核心部門——種子團隊——的所有成員,推出新一輪「豆包股」認購計畫,發行價定為每股13美元(約人民幣88.4元)。此舉標誌著該公司首次推出與單一事業單位深度掛

字節跳動已針對核心人工智慧人才推出基於股權的激勵計畫,透過「豆包」平台向其人工智慧團隊開放內部股票認購,認購價格為每股13美元,旨在加強長期利益連結與