Compare Plans

G.723.1声码器

4.7.1 G.723.1性能特点
       G.723.1是双速率I.PAS声码器,低速率的编码比特率为5.3kbit/s,高速率为6.3kbit/s,线性预测也采用前馈型前向自适应,并使用预视。帧长30ms,分为4个子帧。即每个子帧含60个抽样信号,予视7.5ms。
      ITU-T/制订G.723.1标准的主要应用目标是低比特率可视电话,要求比特率低于9.6khit/s,后来提出的候选方案都在5.0~6.8kbit/s范围内,因此决定采用6.3kbit/s,后来为了增加灵活性又增加了5.3kbit/s速率。根据帧长和预视长度估计其单向系统时延为97.5ms。实际上该时延值是根据应用要求反推得到的。在可视电话中视频帧长为200ms,话音时延应与之适配。考虑到话音可能包含一次编码汇接,因此其单向时延应不大于I00ms,并由此确定了帧长。
       和G.729相比,线性预测和激励生成的基本原理相同,其主要区别是6.3kbit/s模式固定码本激励信号的空间划分有所不同。G.729是将子帧空间划分为4个子集,在每个子集中确定l个脉冲激励,称之为代数码本激励(ACEIP),5.3kbit/s模式与之基本相同。6.3kbit/s模式是将子帧空间划分为奇偶2个子集,然后在其中一个子集的任意位置确定固定数量的脉冲激励,称之为多脉冲最大似然量化器(MP-MLQ),对应的搜索方法称为顺序多脉冲搜索法。另一点差别是基音预测方法。G.729采用的是自适应码本法,候选码本矢量直接输入加权合成滤波器,由此搜索确定最佳矢量。G.723.1采用的是基音预测滤波器法,最佳码本矢量经由独立的预测滤波器搜索确定。另外,G.723.1帧长较长,比特率自然可以降低,其代价是时延加大。复杂度则介于G.729和G.729A之间。话音质量和G.729相仿。
4.7.2    G.723.1编码器
       G.723.1编码器结构如图4.11所示。图中输入信号y[n]为16bit线性PCM信号,其它型式的输入信号必须经过适当转换处理。成帧器采集240个抽样信号组成帧信号S[n],经高通滤波器后形成编码器实际处理的帧信号x[n]。x[n]划分成60个抽样信号一组
(子帧),供后续处理。
     线性预测编码(LPC)分析对每一子帧输入信号进行自相关系数计算,经递推得出10阶线性预测滤波器Ai(Z)的系数{aj}。最后一个子帧滤波器A3(Z)的系数转换成线谱对(LSP)系数,去除直流分量后,采用3段分割矢量量化,每段码本索引为8bit,总共为24bit,发往接收方。
      上述LSP量化值经解码、内插后,构成当前帧各个子帧的合成滤波器G.723.1声码器(图1):
 
G.723.1声码器(图2)
 
同时,根据LPC分析计算得到的Ai(Z)构成共振峰加权滤波器Wi(Z):
G.723.1声码器(图3)
式中,r1=0.9,r2=0.5。输入信号x[n]经此滤波器成为加权信号f[n]。
为了进一步改善编码话音质量,又设置了谐波噪音整形滤波器Pi(Z):
G.723.1声码器(图4)
L为基音周期估值。此滤波器输出 w[n]为编码实际使用的加权信号。
上述三个滤波器级联构成编码使用的加权合成滤波器Si(Z):G.723.1声码器(图5)
其冲激响应记为{hi(n)},n=0,..·,59,i=0,…,3,由冲激脉冲响应计算器模块算得后送至激励信号生成模块,供后者计算误差均方差使用。
信号f[n]还送往基音估值模块。该模块采用开环计算法,每2个子帧(120个抽样信号)计算一次基音周期,记为Llo,其搜索范围为18-142抽样周期(即2.25ms-17.75ms)。基音估算方法是最大化下述函数:
G.723.1声码器(图6)
估算得到的LLO馈至各相应模块。
零输入响应模块根据存储器存储的上一子帧值和S(Z)求得零输入响应Z[n]。差值信号t[n]=W[n]-Z[n]即为目标信号。
G.723.1声码器(图7)
 
图4.11  G.723.I编码器结构
 
t[n]首先经基音预测处理,采用5阶基音预测器,得到信号p[n]。基音预测器相当于自适应码本,p[n]相当于零状态响应。预测器采用闭环预测确定基音时延。子帧0和2的搜索范围为Lo1.士l,由于其值范围为18-142,因此码本索引需7bit。子帧1和3的基音时延值表示为与子帧0、2时延值之差,其差值范围为-1,0,+1,+2,因此码本索引只需2bit。上述各子帧的基音时延值记作Li,i=0,···,3。
残差信号,即原信号和重构信号之差r[n]为:
r[n]=t[n]-p[n]                    (4.62)
基音预测器通过闭环分析确定基音时延和增益,使残差方差为最小。增益和时延量化同时完成。
编码的最后一步是对r[n]进行量化,采用固定码本矢屋量化,高速率和低速率编码的固定码本结构不同。
6..3kbit/s编码器采用MP-MLQ。记r'[n]为r[n]的量化值,有:
G.723.1声码器(图8)
为多个激励脉冲。其中,G为增益因子,ak为脉冲符号(±),mk为脉冲位置,M为脉冲数。在偶数子帧中,M=6;奇数子帧中,M=S。脉冲位置有一定限制,在同一子帧中,所有脉冲位置或者全部为奇数位置,或者全部为偶数位置,也就是说只能在30个可能位置上置激励脉冲。最后选定的究竟是奇数位置还是偶数位置需有1个比特指示,此比特称为格栅(Grid)比特。
此固定码本搜索就是要确定G、ak和mk,其搜索判据是最小化下述星化误差:
G.723.1声码器(图9)
其中,G采用标量量化;符号ak需M比特;脉冲位置采用G.723.1声码器(图10)组合编码,偶数子帧需20比特,奇数子帧需18比特。
5.3kbit/s编码采用和G.729相同的代数码本。每个码本矢量至多含4个非零脉冲,各个脉冲的可取位置如表4.4所示。由表可知,符号矢量需4bit,脉冲位置需3x4=12bit。另外,所有脉冲位置允许同时移一位,即占奇数位置,为此另需1bit指示奇偶位置,称为格栅比特。所以固定码本矢量共需17bit。
表4.4 5.3kbit/s编码固定码本矢量中的脉冲位置
G.723.1声码器(图11)
码本搜索判据为最小化下列函数:
G.723.1声码器(图12)
式中,G为码本增益,H为S1(z)的冲激响应矩阵,Vε为表示脉冲位置和符号的码本矢量。由于采用代数码本结构,搜索计算可大为简化。G采用标量量化。
每一子帧在完成上述所有计算,继续进行下一子帧计算之前的
最后一项工作是更新Ai(z)、wi(z)和Pi(z)的状态,也就是将重构激励信号e[n]经加权滤波器处理,更新存储器值,供下一子帧计算零输入响应。
根据以上分析可得二种速率编码的比特分配如表4.5和4.6所示。
表4.5 6.3kbit/s参数编码的比特分配
G.723.1声码器(图13)
 
表4.6 5.3kbit/s参数编码的比特分配
 
G.723.1声码器(图14)
 
4.7.3 G.723.1解码器
       G.723.1解码器结构如图4.12所示。解码按帧进行。首先解码量化的LPC索引,建立LPC合成滤波器A(z)。
       对每一子帧,解码接收到的自适应码本激励和固定码本激励,其和e[n]输入合成滤波器。
       自适应后置滤波器包括基音后置处理器和共振峰后置滤波器。
G.723.1声码器(图15)
 
图4.12    G.723.1解码器结构
       前者为长时相关滤波,置于合成滤波器之前,按子帧执行,用于改善合成话音质量。后者为短时相关滤波,置于合成滤波器之后。
定标单元恢复原信号能量。其定标值为:
G.723.1声码器(图16)
     然后据此值及上一子帧的比例因子,组合生成本子帧的比例因子:
G.723.1声码器(图17)
     取a=1/16。最后输出话音信号为:
G.723.1声码器(图18)
       此外,和G.729一样,解码器也设有帧丢失处理功能。如果发现帧丢失,解码器由正常解码方式转为帧丢失屏蔽方式,通过以前数据和内插操作生成替代话音帧。

下一篇

H.323设计原则和协议栈结构

通信知识

H.323设计原则和协议栈结构

H.323设计原则H.323标准由ITU-T制订,已在工业界广为采用,是IP电话系统最重要的技术基础,也是各厂商设备互通的技术依据。其设计原则是: (1)适用业务是包括话音、数据和视频及其组合的多媒体通信。其中,对话音通信的支持是必备功能,数据和视频通信是任选功能。H.323版本1的目标应用就是可视电话,其后版本扩展为一般的多媒体应用。 (2)适用网络是基于分组的网络(P ...

相关内容

模数转换器ADC的工作原理(轻松理解ADC含义及运作)

模数转换器ADC的工作原理(轻松理解ADC含义及运作)

ADC值的含义和计算方法ADC(模数转换器)是一种将模拟信号转换为数字信号的设备......

通信知识

2024-07-03

处理器是cpu吗

处理器是cpu吗

CPU是处理器的一种,但处理器这个词更广泛,可以指代多种执行计算任务的硬件设备。......

通信知识

2024-06-13

话务呼叫系统(提高企业通信效率的必备利器)

话务呼叫系统(提高企业通信效率的必备利器)

什么是话务呼叫系统?话务呼叫系统是一种用于提高企业通信效率的必备工具。它是一种集......

通信知识

2024-04-11