最大的嵌入式麦克风供应商Knowles表示,它已经推出了一种数字信号处理器,可以让电子设备通过简单的语音命令进行控制。该处理器还可以让智能扬声器和其他消费设备更准确地识别嘈杂环境中的声音,并抑制背景噪音。
该公司的最新芯片旨在为从闹钟、家用电器到智能手机和其他配备语音助手的消费设备(如亚马逊的Alexa、谷歌的Home和苹果的Siri)提供语音控制功能。Strategy Analytics的数据显示,去年第四季度智能音箱的销量约为420万台,高于上一季度的60万台。
该芯片能够处理人类语音,过滤背景噪音、回声和混响,同时放大和锐化说话人的声音。该公司为IA8508添加了定制芯片,这样它就可以处理通常在云上运行的人工智能算法。
该公司智能音频业务总裁迈克尔·波拉切克(Michael Polacek)表示,客户正试图“在更接近人类的地方”处理语音命令,这意味着更接近麦克风。他对电子设计补充道:“如果你能把更多的计算从云端转移到设备上,然后从设备的深处转移到边缘,你就能更好地理解环境和房间里有多少人。”
该芯片包含三个数字信号处理核心。高性能核心可以编程以提高对遥远的声音的敏感性,而低延迟核心设计改善有源噪声消除。低功耗核心可以编程为同时侦听多个单词 - 使用户能够在控制烤箱时发出“烘烤”和“预热” - 而不会消耗太多的电池寿命。
根据Knowles的说法,设备上的处理可以降低延迟,为用户提供更大的隐私。低延迟对于智能耳机来说可能很重要,因为它必须实时放大微弱的声音,并抑制拥挤的城市街道上的大声聊天。IA8508将于2018年第一季度投入生产。
该公司表示,该芯片将降低制造商为设备添加语音控制功能的门槛。最终,这将有助于Knowles销售其核心业务——麦克风。该公司拥有超过40%的麦克风市场份额。该芯片的设计目的是为电子设备提供更多的语境感知,它可以连接8个麦克风
竞争也在加剧。总部位于德克萨斯州奥斯汀的Cirrus Logic公司销售的芯片可以消除背景噪音,并利用四个麦克风阵列推断声音的方向。上个月,Xmos宣布已经筹集了1500万美元的风险投资,用于开发语音应用的多核微控制器。另一个主要参与者是硅谷的Synaptics。
这些公司专注于改善远场语音处理的当前状态。“五年前,有一个假设您可以在五英尺之内与一台设备交谈,一到两英尺多次,”Sensory的首席执行官Todd Mozer of Sensory,它销售了可以嵌入的关键字检测软件在灯泡,厨房用具和其他电池供电的设备。
“在过去的几年里,人们说他们想要识别30英尺外的声音,这意味着更多的混响、更多的背景噪音和更高的信噪比,”他告诉《电子设计》。
许多公司还试图提供电子设备能够处理越来越先进的人工智能应用。上个月,谷歌的Pete Warden呼吁半导体行业开发电脑芯片,可以掌握像蚱蜢的唧唧喳喳或敲入工业机器一样简单的声音,并且廉价地掌握了像蚱蜢的基本命令 - 并且足够便宜到一次性。