EDN China > 商情观察 > 消费电子设计 > 音频处理 > 正文
? 2016博客大赛-不限主题,寻找电子导师,大奖升级??

智能语音交互的进化

2015年01月16日 ?? 收藏0
  语音交互的进化历程

  回顾人类发展历史,不难看出,随着人类不断进化,从最初通过手掌、肢体使用简单工具、传递简单信息,发展到控制发声并通过耳朵接收,形成了一个以语音为载体的快速信息传递通道和收发闭环,成为人类间最自然、最重要的信息交互手段。声波作为一种音频信号,和视频信号、无线电信号一样是,非接触方式传播,也是人类唯一可以不借助工具就可自由掌控的一种天然“无线”资源。

  而且声波对接收指向性的要求更宽松,这个非常宝贵的特性会在很多场景下带来极大便利。特别是对于一些在视觉、触觉等方面存在障碍(如老年人、弱视、残障人士)或不适合(如儿童需要保护视力)的庞大特定人群,语音更是最佳的交互选择。

  而作为这种功能在移动端延伸,手机相关的语音交互功能最早要追溯到十几年前的功能机时代。它最初是以语音拨号的形式来实现这种交互,当时以摩托罗拉、诺基亚为首的一批国外手机厂商,通过预先录制预存用户的语音样本,然后使用时由用户进行语音口述,比对预留样本,从而实现语音拨号的功能。

  这项功能后续进行了进一步的发展,例如摩托罗拉在其A系列上从语音拨号进化到语音控制层面,就是通过语音能控制手机发短信、打开应用程序诸如音乐等。但是,这一阶段的语音交互技术有个致命的问题,就是准确性不高。因为它采用的是通过预存样本比对的技术来实现,这样的技术受限度很大,主要有以下三个:

  A、受外界背景噪音干扰:因为是采用的样本音频分析对比,所以对来源音频的质量要求较高,如果来源音频背景噪音太严重,会造成与预留样本不符而比对失败。想想,你在一个安静的环境里录完音,然后在大街上去使用,这种成功率会高吗?

  B、使用者发音前后不一干扰:

  同样的道理,你预留的样本音频是健康时的,而使用时因为风寒感冒了,很可能会造成比对失败,这样也会影响成功率。

  C、其它使用者无法使用:你的样本是你自己的,如果换成你的爱人,或者小孩,按照这种样本对比,就根本无法使用了。

  以上这些因素,造成之前的手机语音功能识别率太低,如同鸡肋,所以也没有在手机中起到决定性的作用。

《电子技术设计》网站版权所有,谢绝转载


上一页1234下一页
?? ?? ??


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
?? ??

语音交互? 人工智能? 大数据? 智能机器人?

相关文章

我来评论
美国的游客
美国的游客 ??? (您将以游客身份发表,请登录 | 注册)
?
有问题请反馈