2025-01-10 新品 0
别轻视每一位中文语音助手,真正的技术才是关键。
四年前,亚马逊推出搭载语音助手 Alexa 的智能音箱 Echo,并引入了 Voice First 理论。当时,Echo 的负责人 Mike George 认为语音交互具有极高的易用性和直觉化程度,因此未来人机交互将围绕着语音展开。尽管当时 Siri 已经存在,但人们更多地只是在玩笑中使用它,而不是从实际应用角度去讨论如何使用 Siri。
人们对语音交互持有天然的怀疑,因为图形界面已经成为舒适区。然而,亚马逊坚信问题不在于语音交互本身,而是在于如何通过这种方式与用户进行有效交流。通过 Echo,亚马逊大胆地摆脱了图形界面的依赖,用一种新的形式——智能音箱——强迫用户通过声音与设备进行交流。
随着屏幕消失的声音指导开始,我们发现,在某些场景下,语音交互竟然非常方便且高效。早晨起床刷牙的时候,可以询问 Alexa 今天的天气,让它播放喜欢的音乐。这就是智能音箱核心优势所在:不需要键盘鼠标,不需要触摸屏,就能与计算设备隔空交流。
后来的事实我们都知道了:谷歌、苹果成了追随者,其产品Google Home、HomePod正是对 Voice First 理论的一种认可。而苹果虽然主打的是声音质量,但在发售时间上晚了一步,最终销量也未能如预期般好转。在同期,它们只占据市场的一个小部分,而 Echo 却销售超过 400 万台。
Echo 在这领域取得领先,并迅速扩张至各种硬件,从智能家居到车载系统,无处不在。甚至连谷歌也不例外,它们也意识到了这一点,所以CES 上,他们展现了大量支持Alexa或Google Assistant第三方硬件,这样形成了一种“一呼百应”的态势。
但亚马逊明白,只有软件体验才能让 Alexa 更加丰富和完备,最终构建一个完整平台并实现生态化。这就是Skills(技能)的由来,它允许开发者为Alexa开发应用和功能,使得用户可以利用Alexa访问第三方服务。(类似于App Store上的App)。到目前为止,有超过15,000项Skills可供选择,这远超谷歌Action(动作)的数量,更不要说SiriKit还处于起步阶段。
这样的生态丰富性使得Alexa独树一帜,但这并不意味着其体验会碾压Google Assistant或Siri。在基础功能方面,即使是最简单的问题解答,比如天气预报等,大多数情况下这些AI都提供相似的体验。但这是Blueprints(技能蓝图)诞生的源动力之一。
Blueprints 类似于针对Alexa的工作流程,让用户无需编程知识就能创建自己的技能,只需填充预设模板中的问题答案即可。此举使其成为一个Workflow或IFTTT-like工具,将众多功能更自然地结合起来,以实现像自动关闭灯光、锁门、启动洗衣机等操作,如同喊“我要上班”就能自动安排Uber之类的事情,这将是未来Voice First世界的一大突破,使其接近系统概念水平。而带屏幕但主要依靠声控的Echo Show,以及最近发布的带屏幕Smart Display产品,则拓宽了这个世界版图,让信息展示更加高效,如直接显示折线图而非逐日播报温度数据。
作为Voice First领域领军者,亚马逊已经描绘出了一个完整蓝图,为我们展示这样一个乌托邦。但无论未来的世界是否被Voice First所主导,它至少会是一块不可忽视的大蛋糕。而今年CES上,无论是亚马逊还是谷歌,都希望能够抢占这个领域的地位,以确保自己作为下一代操作系统或者零售入口的地位。