让 Apple Vision Pro 给汽车座舱开开脑洞_当前热议

一觉醒来，科技圈又过年了。

在苹果 2023 年的全球开发者大会上上，筹备已久的全新混合显示头显设备 Apple Vision Pro 终于亮相：2300 像素的双 micro OLED 显示屏、M2+R1 双芯片组合、单眼像素超过 4K、全新的 VisionOS 操作系统……

Apple Vision Pro 的亮相无疑给如今的元宇宙和 XR 领域带来了一剂强心针。而苹果自己对于 Apple Vision Pro 的定位也颇为高调，「今天标志着计算技术新时代的开端。如同 Mac 将我们带入个人计算时代， iPhone 将我们带入移动计算时代，Apple Vision Pro 将带我们进入空间计算时代。」库克把它摆到了与 Mac、iPhone 同样改变时代的地位，似乎借助 Apple Vision Pro 就能将狭小的空间变幻出无限的可能。

(资料图片仅供参考)

提到空间，就不得不说智能座舱这个「第三空间」。在如今这个万物皆可上车的时代，在智能座舱场景下，Apple Vision Pro 能发挥什么作用？库克口中「开启空间计算时代」的产品又能给智能汽车带来什么？

在苦等「Apple Car」无果的时候，我们一起开启脑洞来畅想一下：看看 Apple Vision Pro 在车上有哪些应用场景？作为交互大佬的苹果，在它的第一款 MR 可穿戴设备上，又能给座舱交互带来哪些指引呢？

Apple Vision Pro

如何定义下一个计算时代？

评价如此高的 Apple Vision Pro 究竟有什么超乎寻常的功能，我们一起来复习以下：

a. 混合现实（MR），既能显示虚拟场景，也能显示现实场景。

不同于目前行业内 AR（增强现实）、VR（虚拟现实）泾渭分明的路线，Apple Vision Pro 的效果更像是二者融合。戴上设备后，Vision Pro 可以把任何地方当成一个大型的显示屏，把内容投射在眼前，不仅能看到虚拟世界的界面，也能看到现实场景。既带来沉浸感，也不影响与外界的交流。

b. 无外接手柄，视线移动+手势+语音控制操作：

在交互层面，Apple Vision Pro 省掉了目前 VR 头显普遍用的手柄，采用视线捕捉+手势+语音交互的方式。

c. 与周围人互动，Apple Vision Pro 上会显示「眼睛」的 Eyesight 技术：

相比于目前 VR 头显的封闭场景，Apple Vision Pro 做了与外界的交互。当外界有人靠近佩戴者时，Vision Pro 的黑色外壳可以变得透明，让周围的人看到用户的眼睛，并让周围的人意识到用户正在关注什么事情。

d. 既是独立智能载体，也可以与苹果其他硬件无线连接：

苹果这次给 Apple Vision Pro 提前预埋了充足的场景和生态：可以与 Mac、iPhone 和 iPad 等设备无线连接，实现备忘录等信息的同步；使用 FaceTime 通话时，Vision Pro 可通过机器学习技术创建真实用户形象，实时反映面部和手部动作。

无数 AR、VR 设备的先例告诉我们：没有场景和生态的硬件，是无法独立生存的。苹果这次发布不仅配齐了自家软硬件生态来搭配合，发布会上站台的迪士尼、首批签约的微软办公软件等，都在一定程度上保障了生态和场景的丰富性。也让 XR 设备从目前的游戏交互向生产力工具的转型，能在工作、家庭娱乐、语音通话、观影等不同场景下的应用。

那在座舱场景下如何应用呢？

给屏幕做减法

给智能座舱引入 AR 技术、搭配可穿戴设备，在汽车上不算新鲜了。

前有如今越来越多用在量产车上的 AR-HUD，后有蔚来跟 Nreal 联手开发的原生车载 AR 眼镜 NIO Air AR Glasses。将仪表信息投射在驾驶员实现正前方，或者借助 AR 眼镜看电影，目的都是为了在更舒适的视线区域展示丰富的信息。

仪表屏、中控屏、副驾娱乐屏、后排娱乐屏…… 随着座舱里屏幕越来越多，也有不少「屏幕光污染」「后排娱乐屏遮挡视线」的声音。

这时候，如果 Apple Vision Pro 取代副驾娱乐屏、后排娱乐屏，办公、开电话会或者看电影时，画面瞬间从笔记本电脑、车载娱乐屏的实际英寸，放大到最大 100 英尺；在保证更高分辨率的同时，投射在现实场景中的虚拟界面既能满足随时随地办公、娱乐的沉浸感，也不影响与驾驶员的互动。这样看来，在不考虑价格的情况下，Apple Vision Pro 似乎比传统 AR、VR 头戴设备更有优势，也给了「多屏幕 diss 者」提供了一种替代车内娱乐屏的选择。

当然，在给座舱屏幕做减法的同时，增加了头戴设备这种外设硬件，会不会有点鸡肋？只能说仁者见仁吧。

何况这只是第一代设备，谁知道未来 MR 头戴设备是不是能进化成像普通眼镜甚至视网膜投影那样「精简」呢？

视线控制 +语音 +手势的多模态交互

一直以来，通过多模态交互融合来提供更准确、主动的交互都是座舱交互尝试的方向，语音+触控、语音+手势已经成了目前量产车上常见的功能。不过将视线控制加入到座舱多模态交互中，在量产车的实际使用中还比较少，主要在智能驾驶的 DMS 视线追踪、中控屏幕熄屏控制等功能下出现。

类似 Apple Vision Pro 中视线控制+语音+手势这种「看哪打哪」的交互方式，更多停留在概念 demo 舱中。

之所以这样，除了当前多模态感知技术的限制外，驾驶场景下驾驶员视线是绝对的「宝贵资源」，优先分配在前方路况中。无论是触屏、语音还是手势控制，对于驾驶员位来说，尽可能减少对视线的干扰、少占用视觉资源是必备条件。这是驾驶与头显设备使用场景功能不同带来的差别。

因此，在现阶段智能驾驶 L2+的水平，法律法规要求驾驶员不离眼不离手的情况下，Apple Vision Pro 中视线控制似乎对于副驾驶和后排乘客用处更大，通过眼球捕捉配合语音、手势的交互，来弥补不方便触屏、语音控制场景下的短板，也能提高语音+手势交互的准确率。

特别是在如今在部分座舱中采用的 3D-Tof 功能，眼球捕捉的加入，能进一步提升 3D-Tof 的精确度和动作限制，也许能让座舱内的多模态交互向着更精确、更方便的方向发展。

同时眼球捕捉配合 Vision OS 的动态注释点渲染，可以将最大的画质精确地传递到眼睛正在注视的每一帧，提升座舱内交互的精确度和体验。

HeySiri，语音交互更接近自然语言

与 Apple Vision Pro 同时在 WWDC23 上亮相的，是 iOS 17 的升级。在 iOS17 中，Siri 的唤醒不再是熟悉的「Hey Siri」，而是更直接的「Siri」。老实说，现实中我们与人交流时，也很少会用「Hey XXX」的句式开头，更多的是直接称呼对方。Siri 唤醒次这次的精简，让人与语音助手之间的交互更接近自然交互方式。

让语音交互更接近自然语言，也是目前智能座舱内语音交互的趋势。从去年开始，语音免唤醒出现在了部分车型里。在特定场景、功能下的免唤醒词，甚至全场景下的免唤醒词，这对于系统过滤日常对话中误触发的考验更高。

伴随着唤醒次的精简，交互过程越来越简短流畅，让语音助手越来越「听得懂人话」，让指令的容错率越来越高等等，都让语音交互向着类人、为人类带来便利体验的方向进化。

用 Eyesight 打破「第四堵墙」

在目前的 VR 设备中，当沉浸在 VR 营造的虚拟世界时，用户看不到外界的环境和反馈。头显设备就好像戏剧舞台上的「第四堵墙」，把用户和外界的交流隔绝开。这在营造沉浸感的同时，也带来了一种被隔绝的不安全感，一定程度上限制了 XR 设备使用的场景。

Apple Vision Pro 混合现实的意义，就是将虚拟场景显示在现实场景中，将虚拟和现实融合的同时，借助 Eyesight，Vision Pro 的外屏幕能显示出虚拟的眼睛，等于给封闭式的沉浸场景打开一扇交流的窗口。

对于汽车来说，车身和车窗也构成了这样一个半封闭的空间。近年来越来越多品牌用「智慧灯语」等方式让车辆与外界互动，也许 Eyesight 未必不是打破智能汽车「第四道墙」的一种方式：既能保障车内的隐私，又能实时打开与外界交流的通道。

最后

就在 Apple Vision Pro 亮相前 3 个月，智能穿戴设备的古早玩家 Google Glass 正式宣布停产。一代科技传奇的退场，有技术路线选择失误的原因，但更多的是因为生态和场景的乏力。

大家对于 Apple Vision Pro 期待如此之高，除了对于苹果技术的信心外，更多的也是苹果一直以来在生态和场景上的优势加持。软硬件的能力，决定了 Apple Vision Pro 的下限，未来场景和生态的拓展，决定了它的上限。

因此，如果站在当下看，给智能汽车配一台 Apple Vision Pro 似乎惊喜寥寥，甚至有点鸡肋；但是，Apple Vision Pro 能衍生出怎样的场景，给智能座舱领域带来哪些颠覆，是无法预知的未来。毕竟以往的苹果，给我们带来过太多的惊喜。

本文作者：米其林

不要忘记关注「极客汽车」的微信视频号哟！