
阿里巴巴最新一代的大型模型——qwen3.7-max preview與qwen3.7-plus preview,已正式於qwen chat與arena ai平台(原名lmarena)上線,開放全球用戶體驗。據官方消息,該系列模型預計將於5月20日舉行的阿里雲峰會期間進行全球首發。
作為qwen3.7旗艦系列的預覽版,qwen3.7-max preview專注於卓越的推理能力,在多項權威基準測試中表現強勁。目前,這兩款預覽版仍處於「思考模式」,尚未啟用網際網路搜尋或程式碼解釋器等進階功能。在arena ai的文字理解排行榜上,qwen3.7-max preview位居第13名;而在阿里巴巴自建實驗室的評估體系中,則名列第6。其各項具體指標表現尤為亮眼:數學推理排名第7,專家級應用及軟體/it領域均排名第9,編程能力亦位居前十。
在視覺理解方面,qwen3.7-plus preview於arena ai的視覺理解排行榜上位居第16名,協助qwen在所有參與視覺評估的實驗室中躍升至第5位。特別值得一提的是,在專門測試複雜提示工程技巧的「專家競技場」中,qwen3.7-max preview也取得了第9名的好成績。隨著阿里雲峰會的臨近,業界觀察者正密切關注qwen3.7系列在多模態協作、工具調用以及生產級部署等領域的完整演進路徑。