
近日,business insider報導稱,anthropic正推進一項代號為「marlin」的專屬優化計畫,旨在大幅提升其編碼助理claude code的實際開發就緒度。該專案由資料標註服務供應商snorkel ai全權執行,匯集了約一千名具備真實世界工程經驗的軟體開發人員。透過密集且以場景為導向的反饋迴路,這項努力試圖使模型的輸出更貼近工業級的編碼實踐。
與通用型資料標註不同,marlin專案著重於在極具真實感的工程情境中對模型進行微調:外包工程師需根據實際開發任務撰寫結構化提示,評估生成程式碼的品質,並對兩種平行模型的輸出進行盲測比較。他們不僅要判斷哪段程式碼最符合預期的提示,還須評估其可讀性、可維護性及細節程度——最終目標是「讓claude code能夠撰寫出更乾淨、更穩健的程式碼,並更貼近人類工程師的直覺作法」。
參與者透露,每項任務的報酬為280美元,通常約需60分鐘完成;然而,由於審查標準嚴格,部分提交作品需經過snorkel多輪反饋與修訂。值得注意的是,所有評估均在完全隱藏模型版本資訊的情況下進行,以確保客觀公正的回饋。目前,該專案仍處於持續迭代的階段。