阿里巴巴推出新一代AI模型Qwen36-Max預覽版,編程能力大幅提升

阿里巴巴推出新一代AI模型Qwen36-Max預覽版,編程能力大幅提升


阿里巴巴近日正式發布了通義千問系列的下一代旗艦型號——通義千問3.6-max預覽版。作為該系列的早期預覽版本,用戶現可在通義千問工作室與其進行互動對話,並透過阿里雲百煉api以「通義千問3.6-max預覽版」之名調用。與上一代通義千問3.6-plus相比,新模型在多個面向皆有顯著提升,涵蓋基於智能代理的編程能力、世界知識以及指令遵循等。

據阿里巴巴透露,通義千問3.6-max預覽版在六大主要編程基準測試中均取得最高分,涵蓋swe-benchpro、terminal-bench2.0、skillsbench、qwenclawbench、qwenwebbench及scicode等項目。具體而言,其基於智能代理的編程能力顯著提升:skillsbench得分提高9.9分,scicode提升10.8分,而nl2repo與terminal-bench2.0分別提升5.0分與3.8分。這些成績標誌著該模型在編程能力方面邁出了重要一步。

此外,通義千問3.6-max預覽版在世界知識的掌握上亦有明顯進步,supergpqa得分提升2.3分,qwenchinesebench則提升5.3分。其指令遵循能力同樣出色,toolcallformatifbench得分亦提高2.8分。綜合各項表現,這款新模型堪稱智能編程領域的重大創新。

雖然目前僅提供預覽版本,但阿里巴巴表示,該模型仍處於積極研發階段,未來將持續優化,以帶來更強大的功能與性能提升。

人工智慧教父楊立昆公開駁斥Anthropic執行長:別相信那些關於人工智慧將導致大規模失業的「危言聳聽」

近日,社交平台x上爆發了一場關於人工智慧是否會引發大規模失業的激烈辯論。剛剛離開meta創立ami實驗室的「人工智慧教父」楊立昆,與anthropic執行長達里奧·阿莫代伊公開交鋒

人工智慧教父楊立昆公開駁斥Anthropic執行長:別相信那些關於人工智慧將導致大規模失業的「危言聳聽」

阿里巴巴推出新一代AI模型Qwen36-Max預覽版,編程能力大幅提升

阿里巴巴近日正式發布了通義千問系列的下一代旗艦型號——通義千問3.6-max預覽版。作為該系列的早期預覽版本,用戶現可在通義千問工作室與其進行互動對話,並透過阿里雲百煉ap

阿里巴巴推出新一代AI模型Qwen36-Max預覽版,編程能力大幅提升

月之暗面推出其最強大模型——Kimi K26,具備與GPT-54相媲美的代碼生成能力

月之暗面團隊昨日正式發布並開源了其最新模型——kimi k2.6,並在程式碼撰寫、長時間任務執行以及代理群集能力等方面實現了全面升級。自今日起,所有用戶均可透過官方網站、最

月之暗面推出其最強大模型——Kimi K26,具備與GPT-54相媲美的代碼生成能力

OpenAI Codex推出Chronicle功能:透過螢幕錄影建立知識庫

近日,openai 為其 codex 應用程式推出了一項名為「chronicle」的新功能,該功能透過螢幕錄影來建立情境記憶庫。這使 codex 能在後續任務中自動引用用戶先前的作業內容,無需每

OpenAI Codex推出Chronicle功能:透過螢幕錄影建立知識庫

OpenAI推出ChatGPT團隊工作流程AI代理:全天候在線,自動化長期複雜任務

今日,openai 發佈了一篇部落格文章,宣佈在 chatgpt 中推出工作空間代理功能,讓團隊能夠建立協作型代理,處理複雜任務與長期工作流程。此功能針對跨時區與跨工具協作中的關鍵挑

OpenAI推出ChatGPT團隊工作流程AI代理:全天候在線,自動化長期複雜任務

馬斯克:Model S/X 的最後一批車輛將於五月下線;Optimus 將於七月底開始量產

在特斯拉2026年第一季業績電話會議上,執行長伊隆·馬斯克證實,optimus機器人將於今年7月底或8月在弗里蒙特工廠正式投入量產。該生產線將由原先的model s與model x組裝線改造

馬斯克:Model S/X 的最後一批車輛將於五月下線;Optimus 將於七月底開始量產

谷歌聲稱,新程式碼中有75%是由人工智慧生成的,工程師們也正轉向審查相關職務

當地時間週三,谷歌透露,目前公司內部撰寫的程式碼中,有四分之三是由人工智慧生成,再經由人類工程師審核。這一比例近年來持續攀升——早在2024年10月時僅約四分之一,而到去年秋

谷歌聲稱,新程式碼中有75%是由人工智慧生成的,工程師們也正轉向審查相關職務

小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源

小米今日正式推出 mimo-v2.5-tts 系列與 mimo-v2.5-asr,這是一種專為智能助理時代打造的全棧式語音模型,涵蓋語音辨識與合成這兩項核心功能,實現對語音輸入與輸出的完全靈活語

小米推出端到端語音模型MiMo-V25:TTS限時免費提供,同時ASR也已開源

AI音樂席捲蘋果音樂,但其串流次數僅佔不到05%

蘋果音樂的副總裁奧利佛·舒瑟近日透露,儘管目前由人工智慧生成的音樂已佔新上傳曲目相當大的比例,但其實際播放量卻幾乎可以忽略不計。據舒瑟表示,現今提交至蘋果音樂平台的

AI音樂席捲蘋果音樂,但其串流次數僅佔不到05%

聯想聯想萊酷AI MINI PRO迷你電腦上市,搭載英特爾酷睿Ultra 200V系列處理器

近日,聯想旗下樂扣品牌推出了搭載英特爾酷睿ultra 200v系列處理器、代號「lunar lake」的ai mini pro迷你電腦。該新品目前已在各大電商平台開售,預購與秒殺活動也已同步啟動

聯想聯想萊酷AI MINI PRO迷你電腦上市,搭載英特爾酷睿Ultra 200V系列處理器

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

據媒體報導,上海中自興科技有限公司研發了一款名為neu(神經執行單元)的智能原生設計晶片,並計劃於今年第四季開始流片。根據中自興公開的測試數據,在相同的ai推理任務下,neu晶片

國產人工智慧晶片的新突破:NEU 推理速度最高可達頂級 GPU 的 100 倍,而功耗僅為其十分之一

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

繼今年二月釋出並開源 vla 大型模型 xiaomi-robotics-0 之後,小米今日宣布正式推出該模型面向真實場域部署的全鏈端到端後訓練工作流程,使這款曾榮登 hugging face 全球 vla

小米公開VLA模型的原始碼,並分享完整的訓練流程:僅需20小時即可教導機器人折疊耳塞

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

騰訊雲近日在其 tokenhub 平台上推出了 deepseek-v4 api 的預覽版,標誌著這項尖端大型模型技術在實際應用上又邁出了重要一步。據報導,deepseek-v4 支援高達一百萬個 token

騰訊雲推出 DeepSeek-V4 預覽版 API,支援高達一百萬個 token 的上下文長度

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

當地時間4月26日,openai執行長山姆·阿爾特曼發表聲明,闡述公司在人工智慧發展方面的核心原則與長期目標。他指出,人工智慧有潛力帶來遠超蒸汽機或電力的變革,顯著提升個人能力

OpenAI宣布五項核心原則:確保通用人工智慧造福全人類,並反對權力集中

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!

4月27日,谷歌deepmind的執行長戴密斯·哈薩比斯訪問了韓國,並會見了李在明總統。隨後,他與韓國科學技術信息通信部簽署了一份諒解備忘錄,標誌著雙方在人工智慧領域的合作正式啟

谷歌DeepMind執行長訪問韓國;谷歌人工智慧園區將在首爾設立!