人形機器人感知層（系列第 3 篇）

系列第 3 篇（原文，7/2）聚焦人形機器人的感知層（力覺、觸覺、非視覺、高精視覺），核心主張是這個領域「正處於範式大分裂的核心期」，而真正的戰場不只是硬體效率，更是「感測器 → 大模型（VLA）接口標準的定義權之爭」。他用一張三段式的權力地圖概括全局：美國定義生態（NVIDIA GR00T／Figure Helix 推標準化感知 Token 接口）→ 日本／歐洲卡硬體（XELA 指爪、Sonair 聲吶、Prophesee 事件相機，靠物理與法規死角）→ 中國規模吞噬（宇樹、坤維、漢威，用產能與降本把中國標準做成市場第一）。

2026「定點生死劫」

他把 2026 稱為全球人形機器人商業定點的分水嶺（引述行業預期出貨 5–10 萬台），並提出一個時效性極強的判斷：力／觸覺感測器的定點窗口正在快速關閉。理由是一旦主流本體廠在 2026 下半年完成前 10 萬台供應鏈定點，後進者機會歸零——因為 VLA 大模型已在特定硬體的資料集上訓練了數萬小時，換硬體＝演算法全盤重訓。

他列的商業化里程碑（他的引述，需查證）：宇樹科技 2026/6/1 科創板 IPO 過會，招股書營收 ¥16.99 億（+335%）、淨利 ¥5.91 億（+674%）、擬募 ¥42.02 億，供應鏈名單成二級市場最強催化劑；眾擎（EngineAI）深圳工廠達「每 15 分鐘下線一台」、T800 基礎版 ¥18 萬；Apptronik 2026/6/26 發表 Apollo 2，累計融資近 10 億美元、估值衝 50–55 億美元。

VLA 標準層的絞殺

這是他這篇最有觀點的部分。他認為當具身智能從「純視覺 VLA」跨向「視—聽—力—觸」多模態融合，真正的戰場是誰來定義感測器資料打包成 Token 的接口標準。NVIDIA 用 Isaac GR00T＋Jetson AGX Thor 建「人形機器人的 Android」，透過 SDK 規範接口——「感測器性能再好，不相容 GR00T 的 Token 格式就淪為物理孤島」。

由此帶出他對中國陣營的隱憂：宇樹、眾擎、智元出貨量全球領先，但平台層仍嚴重依賴 NVIDIA 生態，等於「辛苦做材料降本、搞供應鏈內循環，最後都在給 NVIDIA 的 Blackwell 餵資料、抬轎子」，面臨「硬體瘋狂內卷、頂層生態為人作嫁」的白牌化風險。

投資配置建議（他的分區）

美國（掌握作業系統與平台定義權）： $N V D A （具身智能 O S 實際壟斷者）、$ META／ $GO O G （開源具身大模型與 O p e n X - E mb o d im e n t 資料集）、$ NOVN（諾萬塔，子公司 ATI 控盤高端六維力感測器）。
日本／歐洲（精密硬體卡位與法規壁壘）：索尼（6758.T，堆疊 SPAD＋事件相機）、基恩士（6861.T，工業精密感測器）、英飛凌（IFX.DE）／意法（$STM，MCU 與車規／工控雷達）。
中國（全產業鏈＋降本紅利）：漢威科技（300007.SZ，他稱 A 股唯一柔性觸覺／電子皮膚有訂單的稀缺標的）、三花智控（002050.SZ）／拓普集團（601689.SH，特斯拉 Optimus 供應鏈）、宇樹科技（他稱其上市是國產感知鏈產業定點的「發令槍」）。

他收尾用一句對照：「汽車感知的護城河是過車規；機器人感知的護城河是……（原文於此截斷）」，延續他一貫的「卡位＝護城河」論。

我的檢視

宇樹 IPO 過會、Apptronik 融資規模等大方向有第三方佐證，但部分財務數字與估值細節（宇樹淨利、Apptronik「50–55 億估值」「Apollo 2 於 6/26 發表」）與公開資料存在時點或口徑差異，見客觀檢視篇。VLA 接口標準之爭、中國「白牌化」是他最值得一讀的觀點性分析，但屬前瞻推論，並非已定局的事實。方法論同源見帳號與方法論。

我的知識庫

探索

人形機器人感知層（系列第 3 篇）

2026「定點生死劫」

VLA 標準層的絞殺

投資配置建議（他的分區）

我的檢視

關係圖譜

目錄

反向連結