
4月26日,具身智能公司kinetix ai(kai)舉辦了「天賦來臨」發表會,正式揭曉其同名首款全尺寸人形機器人「kai」。此次發表會有別於傳統的產品發布方式:kai並非以常規形式亮相,而是透過兩台kai機器人的「對話與自我介紹」進行首秀,由它們詳細說明自身的功能、技術路線以及產品定位。
聯合創始人泰勒在活動中解釋道:「要讓機器人真正融入人類世界,就必須更具擬人化特質。他認為,人類的物理智能源自與周遭環境的互動,這要求機器人至少在三大關鍵領域具備閉環能力——理解世界、從世界中學習,以及與世界互動——分別對應於物理世界模型、第一人稱資料集,以及高度擬人化的身體。」
所謂「理解世界」,是指讓機器人不僅能感知當前環境,還能預測未來的環境變化——這正是kai的世界模型所實現的功能。
根據展示內容,超維動力的世界模型系統目前已達成閉環架構。除了核心模型外,該系統還包含行動模組與評估模組。行動模組根據當前狀態產生候選動作,並將其傳遞給基礎模型;基礎模型則基於這些候選動作預測未來狀態;而評估模組則綜合考量任務進度、接觸是否安全等因素,評估各條軌跡的價值。
「嗨,我是kai」——超維動力推出全球自由度最高的人形機器人
世界模型解決了「理解世界」的問題,而第一人稱資料集則著重於「從世界中學習」。kai的做法是透過人類的視角與動作來觀察並參與世界,從而獲取更貼近真實場景的經驗。
超維動力自主研發了可擴展的資料收集終端「kai halo」。這款裝置採用輕量頭帶式設計,配備「一芯八鏡頭」配置,可一站式收集人與世界的資料。它不僅能錄製第一人稱視角影片,還能重建人體姿勢與場景點雲。由於裝置重量極輕,使用者在日常活動中也能自然佩戴,因此資料收集過程無需刻意編排舞步,所得資料更能反映真實情境。相較於刻意設計的動作序列,這類資料往往涵蓋更多樣化的動作,因而更適合用於訓練人形機器人。
世界模型使kai得以理解世界,第一人稱資料集則為kai帶來「人類經驗」,但要將這些經驗轉化為技能,仍需一套強大的訓練體系——這便是三階段訓練系統。
在預訓練階段,kai 利用大量的互聯網與模擬數據,並輔以自行收集的第一人稱視角資料,來豐富關於全身與環境互動的語義資訊,從而建構一個能將「空間-語言-視覺-任務行動」相互對齊的「常識」框架。在橋接訓練階段,則使用 umi 與數據採集手套所獲得的資料,來彌補預訓練階段中未能充分涵蓋的精細手部動作與身體接觸等不足之處。到了後訓練階段,則引入特定場景下的實體機器人遙控資料,以解決與機器人自身身體之間的對齊問題。
有了資料與「大腦」之後,最後一步便是提供一個具備能力的物理平台——高度擬人化的身體——讓機器人能夠順暢地融入人類的日常生活,並與人類安全地互動。
這就是 kai 的身體——kaibot。根據介紹,kai 的高度擬人化能力可歸納為四個面向:擬人化的形態、擬人化的體格、擬人化的身體表現,以及擬人化的感知能力。
在形態方面,kaibot 身高 173 公分,體重 70 公斤,頭身比例約為 1:8.5。其整體尺寸與質量分佈與成人人類十分接近,既確保了穩定性,又維持了類似人類的外觀與重心位置。
在體格方面,kaibot 擁有 115 個自由度,肩部可進行 -20° 至 0° 的抬升、-15° 至 0° 的環轉運動,頸部可活動至 -15° 至 50°,腰椎亦可活動至 -15° 至 75°——幾乎涵蓋了人類全身的全部活動範圍,並更貼近人類四肢在複雜環境中自然運作的方式。同時,kaibot 配備了一隻靈巧的手,每隻手擁有 36 個自由度,其中包括 22 個主要控制自由度與 14 個柔順自由度,使其不僅能完成抓取、捏取等精細動作,還能吸收衝擊,展現出更安全、更自然的互動特性。
在身體表現方面,kaibot 搭載了一顆 1.7 kwh 的半固態電池,可支援雙臂連續運作約三小時。此外,其量身打造的柔順驅動器不僅使機器人實現更接近人類的平滑動作,還讓雙臂能夠承載近 20 公斤的重量,兼具使用者友善性與操作效能。
在感官感知方面,kai 配備了全身觸覺皮膚系統,內含 18,000 個觸覺感應器,理論上甚至能偵測到小於 0.1 牛頓的微弱觸碰並即時回饋。這套觸覺系統使擬人化機器人得以在真實場域中與人類密切合作、陪伴左右,建立更高品質的反饋迴路。
記者會尾聲,kai 表示:「我並非為了在沒有工人的人工廠裡搬運重物而生,也非為了在舞台上表演極限特技而設計。我誕生的目的,是走進你的客廳或辦公室,理解你的意圖,回應你的觸碰,最終與你協作、共存。」