Google 打造抛弃式语音识别产品

消息提供:释儒道 来源:1号机器人网
可信度:未知 时间:2017-09-27 22:18:35
\
 
Google 工程师 Pete Warden 在英国 ARM 研究高峰论坛上表示,他希望打造超便宜的语音识别产品,搭载只要 50 美分的超低价芯片,一个硬币大小的电池,足以维持一年的电力,再搭配简单的人工智能算法,就可以让语音识别产品快速普及。

麻省理工科技评论 (MIT Technology Review) 报导,这种超便宜的语音识别芯片可以用来生产便宜的对话玩偶,或是简单的家用电器,如可被语音驱动的灯。在工业环境应用上,这种芯片可识别不寻常的声响,或是识别农田里的蟋蟀。
 
Warden 为 Google 的云端人工智能工具开发移动和嵌入式应用,称为 TensorFlow,他在开发过程中发现亚马逊的 AI 助手 Alexa 透过电池供电的简单芯片运作,时脉只有几百兆赫是不够的,原因是 Alexa 必须辨识许多不同的声音,而且因为大多数语音识别 AI 工具使用的神经网络资源匮乏,这就是为什么 Alexa 必须将处理任务交给云端的原因。
 
为改善上述问题,Warden 限制问题的问法,譬如只能够使用开、关、启动、停止等字眼,并舍弃一般的语音识别算法,他拿一个音频将其切成短片段,然后计算每个片段的频率内容,接着一个接一个地排列每个频率图,以建立一个频率内容与时间的二维图像,并应用视觉识别算法来识别单词的独特记号。
 
第一次尝试分析音频的一秒钟片段需要 800 万次计算,准确度为 89%,这可以在现代智能手机上运作,并且互动上速度也够快,这种方式比将运算过程送到云端更好,但是在低功耗芯片上性能不佳。
 
后来开发团队借鉴一些帮助 Android 手机识别短语的算法技巧之后,系统只需执行 75 万次计算,就能达到 85% 的分析准确率,研究团队已经在 TensorFlow 网站上发布代码供他人使用,他们打算应用在类似单芯片微控制器 Arduino 上搭载的更小芯片上。
 
但英国剑桥大学前 AI 研究员 Tony Robinson 认为,低成本策略可能可以帮助语音识别产品普及化,不过用户不太可能按表操课,绝大多数人没有耐心去使用高度限制性的指令,认为功率稍微高一点,可以处理更多一点语言能力的芯片可能更适合消费者应用。