系列第 3 篇(原文,7/2)聚焦人形機器人的感知層(力覺、觸覺、非視覺、高精視覺),核心主張是這個領域「正處於範式大分裂的核心期」,而真正的戰場不只是硬體效率,更是「感測器 → 大模型(VLA)接口標準的定義權之爭」。他用一張三段式的權力地圖概括全局:美國定義生態(NVIDIA GR00T/Figure Helix 推標準化感知 Token 接口)→ 日本/歐洲卡硬體(XELA 指爪、Sonair 聲吶、Prophesee 事件相機,靠物理與法規死角)→ 中國規模吞噬(宇樹、坤維、漢威,用產能與降本把中國標準做成市場第一)。

2026「定點生死劫」

他把 2026 稱為全球人形機器人商業定點的分水嶺(引述行業預期出貨 5–10 萬台),並提出一個時效性極強的判斷:力/觸覺感測器的定點窗口正在快速關閉。理由是一旦主流本體廠在 2026 下半年完成前 10 萬台供應鏈定點,後進者機會歸零——因為 VLA 大模型已在特定硬體的資料集上訓練了數萬小時,換硬體=演算法全盤重訓。

他列的商業化里程碑(他的引述,需查證):宇樹科技 2026/6/1 科創板 IPO 過會,招股書營收 ¥16.99 億(+335%)、淨利 ¥5.91 億(+674%)、擬募 ¥42.02 億,供應鏈名單成二級市場最強催化劑;眾擎(EngineAI)深圳工廠達「每 15 分鐘下線一台」、T800 基礎版 ¥18 萬;Apptronik 2026/6/26 發表 Apollo 2,累計融資近 10 億美元、估值衝 50–55 億美元。

VLA 標準層的絞殺

這是他這篇最有觀點的部分。他認為當具身智能從「純視覺 VLA」跨向「視—聽—力—觸」多模態融合,真正的戰場是誰來定義感測器資料打包成 Token 的接口標準。NVIDIA 用 Isaac GR00T+Jetson AGX Thor 建「人形機器人的 Android」,透過 SDK 規範接口——「感測器性能再好,不相容 GR00T 的 Token 格式就淪為物理孤島」。

由此帶出他對中國陣營的隱憂:宇樹、眾擎、智元出貨量全球領先,但平台層仍嚴重依賴 NVIDIA 生態,等於「辛苦做材料降本、搞供應鏈內循環,最後都在給 NVIDIA 的 Blackwell 餵資料、抬轎子」,面臨「硬體瘋狂內卷、頂層生態為人作嫁」的白牌化風險

投資配置建議(他的分區)

  • 美國(掌握作業系統與平台定義權)META/NOVN(諾萬塔,子公司 ATI 控盤高端六維力感測器)。
  • 日本/歐洲(精密硬體卡位與法規壁壘):索尼(6758.T,堆疊 SPAD+事件相機)、基恩士(6861.T,工業精密感測器)、英飛凌(IFX.DE)/意法($STM,MCU 與車規/工控雷達)。
  • 中國(全產業鏈+降本紅利):漢威科技(300007.SZ,他稱 A 股唯一柔性觸覺/電子皮膚有訂單的稀缺標的)、三花智控(002050.SZ)/拓普集團(601689.SH,特斯拉 Optimus 供應鏈)、宇樹科技(他稱其上市是國產感知鏈產業定點的「發令槍」)。

他收尾用一句對照:「汽車感知的護城河是過車規;機器人感知的護城河是……(原文於此截斷)」,延續他一貫的「卡位=護城河」論。

我的檢視

宇樹 IPO 過會、Apptronik 融資規模等大方向有第三方佐證,但部分財務數字與估值細節(宇樹淨利、Apptronik「50–55 億估值」「Apollo 2 於 6/26 發表」)與公開資料存在時點或口徑差異,見 客觀檢視篇。VLA 接口標準之爭、中國「白牌化」是他最值得一讀的觀點性分析,但屬前瞻推論,並非已定局的事實。方法論同源見 帳號與方法論