
4月21日,openai發表了一篇部落格文章,正式推出新一代人工智慧圖像生成工具——chatgpt images 2.0。該工具基於gpt image 2模型打造,核心升級在於引入「推理能力」——使用者啟用後,系統可連接網路獲取資訊、根據上傳檔案進行視覺詮釋,並在生成最終結果前對圖像構圖進行推理與規劃。目前此功能僅開放給chatgpt plus、pro、business及enterprise訂閱用戶使用。
在多圖像生成方面,images 2.0實現了重大突破:單一提示詞現可生成最多八張圖像,且不同場景間的人物、物件與風格均能保持一致。openai表示,這將大幅降低創作漫畫頁面、社交媒體圖形系列以及室內設計提案的門檻。例如,使用者只需輸入一段連貫的故事劇本或設計簡報,工具便能自動規劃構圖邏輯,並生成一組風格統一的圖像序列,無需反覆調整提示詞。
業界專家認為,這項升級標誌著人工智慧生成藝術從「隨機生成」轉向「規劃式創作」,尤其為需要大量視覺內容生產的專業人士帶來顯著的效率提升。目前,免費用戶尚無法使用此功能,但openai已表示將評估未來擴展使用權的可能性。隨著推理能力的加入,chatgpt images 2.0有望在教育、廣告及遊戲開發等領域催生更多創新應用。