EDN China > 设计实例 > 微处理器与DSP > DSP应用 > 正文
? 2016博客大赛-不限主题,寻找电子导师,大奖升级??

(多图) IP电话回声消除器的设计及其DSP实现

21ic 华中科技大学 周国强 黄本雄?? 2011年08月01日 ?? 收藏0

  1 在VoIP中采用回声消除技术的必要性

  与传统的PSTN网络采用电路交换技术不同,IP电话采用的是分组交换技术,充分利用Internet来传输语音数据,使得价格大大降低,从而取得了长足的发展。但是IP电话也存在一些弊端,比如语言质量比较差,导致这一弊端的因素很多,其中主要的因素就是网络延时和算法延时,这主要是由于互联网的数据传输特点以及语音编解码耗时较大导致的,总延时长达100ms。根据经验,如果语音的延时超过了50ms,那么,人耳就可以鉴别出自己的回声,显然,IP电话系统的回声是非常严重的,鉴于此,国际电联(ITU)也相应地制定了回声消除的国际规范,如G.165,G.168。

  2 回声消除器的结构框图和基本原理

  图1所示是VoIP回声消除系统结构图。

VoIP回声消除系统结构图

  从图1可以看出,整个回声消除系统分成三个部分:NLMS自适应滤波器、语音检测器和粗略时延估计器。其中,语音检测器又分为三个部分:近端说话检测器、远端说话检测器和双端说话检测器。

  图1中,A、B端代表远端用户,C、D端代表近端用户,y(n)代表时刻n来自远端的语音采样值。y(n)经过互联网到达近端用户的扬声器端,由于从扬声器出来的声音信号经过空气形成的回声通道H(z)又会被近端的话筒拾取,这部分回声信号echo(n)会混同近端用户的语音信号一起进入近端的话筒,也就形成近端的声学信号r(n),r(n)再通过互联网,向远端用户的扬声器传输。如果不采取回声消除措施,只要远端信号y(n)通过互联网传回远端扬声器的时间超过50ms(这是经常出现的情况),那么,这部分被近端拾取的回声信号echo(n)会被远端用户分辨出来,结果就使得远端用户听到了自己的声音,会大大降低通话的质量,这是用户所不能容忍的。所以,必须采取消除回声的措施。

  完成回声消除的一个很重要的模块就是自适应滤波器,本文采用NLMS算法进行自适应滤波。当远端信号y(n)到达近端之后,先把这个信号“复制”一份,放到存储器中,结合误差信号,利用NLMS算法不断调整自适应滤波器的系数,使得y(n)经过自适应滤波器后的输出公式尽量逼近回声信号echo(n),这样,当近端的语音信号x(n)=0的时候,从B端输出的误差信号e(n)也就接近0,从而达到了回声消除的目的。

  当然,在NLMS自适应滤波器进行滤波和系数更新之前,必须检测语音模式是近端说话模式、远端说话模式、还是双端说话模式,因为不同的说话模式NLMS自适应滤波器所执行的功能是不完全相同的。另外,由于远端信号y(n)被自适应滤波器“复制”到存储器中的时刻t1和y(n)经过回声通道H(z),进入近端话筒并作相应的处理的时刻t2是不相同的,t2要大于t1,这主要是语音数据编码、打包和压缩造成的。为了使得滤波器处理的信号y(n)和传回远端的信号r(n)保持对应,即echo(n)和y(n)保持高度的相关性,那么被自适应滤波器“复制”的y(n)信号,最好在存储器中延时一段时间,这样才能保证达到回声消除取得比较好的效果。

  3 NLMS自适应滤波器原理

  为了讨论方便,这里先考虑远端说话模式,即近端语音信号x(n)为0。为了简单起见,把图1中的NLMS自适应滤波器部分单独抽出来,简化成图2。图2所示是NLMS自适应滤波器结构图。

NLMS自适应滤波器结构图

  其中,H(z)传递函数用来表示回声通道的特性。NLMS自适应滤波器就是要尽快地调整自己的系数,使其冲击响应尽量逼近H(z)的冲击响应,这样才能使误差信号e(n)逼近0。具体的实现过程如下。

  自适应滤波器的输出公式由式(1)给出:

公式

  其中:N是NLMS自适应滤波器的阶数。BT=〔b0,b1Λ,bN-1〕是滤波器的系数矢量。公式-1),Λ,y(n-N+1)〕是滤波器n时刻的输入信号矢量。

  由于前面已经假设为远端说话模式,故,近端语音信号x(n)为0。误差信号e(n)可由式(2)给出:

公式

  其中:μ为步长因子,是一个常数,由试验来确定,μ的选取至关重要,为了确保收敛,必须满足0<μ<2。μ取值过大,虽然可以加快自适应滤波器的收敛速度,但是误差信号e(n)也会大,μ取值过小,则使收敛速度变慢。e(n)由式(2)计算。P(n)是n时刻输入信号矢量yn的短时平均功率,公式

  4 语音检测器

  语音检测器在整个回声消除系统中也占据非常重要的地位,这是因为不同的语音模式自适应滤波器所要求执行的功能是不相同的,下面分别说明。

  4.1 远端说话检测器

  当近端用户不说话而只有远端用户说话的时候,就是远端说话模式。式(4)用于检测远端说话模式。

公式

  代表远端信号和近端信号的较短窗功率估计值。是阀值常量,要由实验来确定,取得太大或者太小都会导致检测错误。

  如果检测出为远端说话模式,那么,应该通过图1中的NLMS控制器同时打开NLMS自适应滤波器的滤波功能和系数更新功能。

  4.2 双端说话检测器

  当近端用户和远端用户同时说话的时候,就是双端说话模式。式(5)用于检测双端说话模式。

公式

  表误差信号和近端信号的短窗功率估计值。C是系数常量,C=10ERLE/10,一般ERLE取为8dB。D是阀值常量,要由实验来确定,取得太大或者太小都会导致检测错误,影响滤波效果。

  如果检测出为双端说话模式,则要冻结FIR滤波器的系数更新功能,只需要完成滤波功能,即只要计算滤波器输出r(n)的值。

  4.3 近端说话检测器

  当只有近端用户说话而远端用户不说话的时候,就是近端说话模式。式(6)用于检测近端说话模式。

公式

  表近端信号短窗功率估计值和长窗功率估计值。NES MARGIN是阀值常量,要由实验来确定。

  如果检测出为近端说话模式,那么,应该通过图1中的NLMS控制器同时冻结NLMS自适应滤波器的滤波功能和系数更新功能。


上一页12下一页
?? ?? ??


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
?? ??

IP电话? 回声消除器? DSP? NLMS?

相关文章

我来评论
美国的游客
美国的游客 ??? (您将以游客身份发表,请登录 | 注册)
?
有问题请反馈