
近日,有部分用戶發現,在使用 deepseek 時,輸入像 `<think>` 這樣的特殊標籤,會導致模型產生明顯離題、邏輯斷裂,甚至看似「竊聽他人對話」的回應,這在社交媒體上引發了廣泛討論。一些用戶觀察到,這些異常回覆雜亂無章,既無法與當前對話脈絡相連,又隱約帶有其他問題的痕跡,令人擔憂可能涉及資料混淆或隱私風險。
經技術團隊深入調查後確認,此現象並非由資料洩漏或系統漏洞所致,而是典型的「幻覺」現象——當模型遇到未在訓練過程中充分涵蓋的 xml 式標籤(如 `<think>`)時,會誤將這些符號視為訓練樣本中的內部指令或佔位符,進而觸發非預期的生成路徑。
deepseek 現已在最新版本中修復此問題:透過清理訓練資料、加強對特殊字元的穩健性訓練,並優化分詞器解析類標籤結構的邏輯,已完全消除因輸入 `<think>` 等內容而引發異常回應的情況。應用程式與 api 均已同步更新,使用者無需額外操作,即可享有穩定可靠的互動體驗。
官方聲明簡要版:
關於 `<think>` 引發異常回應的說明
我們注意到,部分用戶反映在輸入 `<think>` 後收到意料之外的回覆。經調查發現,此現象源於模型對未定義標籤的幻覺式回應,屬技術層面的生成偏差,與資料安全、隱私洩漏或系統入侵無關。目前該問題已在所有服務中解決,我們亦將持續提升模型的容錯能力及對邊緣案例輸入的理解。感謝您熱烈的反饋與長期的信任。