激励信号生成-科能调度指挥系统

激励信号生成模型是声码器的主体部分，lPAS声码器的合成分析指的就是激励信号的生成机理，它通过分析比较大量激励源合成的结果，从中选出最佳匹配的激励信号。声码器编码输出的主要部分也是激励信号。lPAS声码器的比特率通常为4-16kbit/s，这表示激励信号的量化比特约为每个抽样0.5~2比特。

激励信号包括清／浊音判定、基音周期和增益。清／浊音可根据话音信号自相关函数归一化峰值电平来判定。若电平值大于给定阙值，则为浊音，否则为清音。如为清音，则激励源为随机信号。如为浊音则为准周期脉冲信号，激励源为空间位置有规律分布的脉冲串，脉冲位置间隔体现为基音周期，它决定了话音信号的长时相关性。如果长时相关也采用线性预测滤波器模型的话，该周期就对应为离散信号的时延。增益则是另一个独立的参数。因此，激励信号生成的主要问题是如何表示和选定浊音对应的脉冲源。

1. 4.3.1 激励信号的表示

1.多脉冲激励(MPE)

其设计思想是只对激励信号的重要抽样编码，忽略其它抽样（即将其置零），以此降低编码比特率。这些重要抽样可用有限数量脉冲的幅值和位置来表示，由此得多脉冲激励信号为：

式中，a_i,n_i,K分别为脉冲幅值、脉冲位置和脉冲数，δ(o)为δ函数。需要编码的信息就是脉冲位置和幅值。采用枚举编码，脉冲位置需5~6比特，幅值约需3比特。取脉冲密度典型值为4脉冲／5ms，则所需比特率为8-I0kbit/s。

为了降低计算复杂度，确定最佳匹配激励时采用每次搜索1个脉冲的简单叠代法。每次通过合成分析法确定1个脉冲的位置和幅值后，在搜索下一个脉冲时必须将该脉冲的响应分量扣除。

2.规则脉冲激励(RPE)

其设计思想和多脉冲激励相同，但是为了降低复杂度，脉冲位置限定为间隔为S的栅状位置，其激励信号表示为：

在给定的子帧中只有S个允许组合位置。激励信号搜索就是针对每种允许的格栅位置计算脉冲幅值和相应误差，选定最佳逼近原信号的参数，它需要求解一系列线性方程组。

3.码本激励

激励信号最终要量化后以二进制的形式发送出去的。量化有两种类型。一种是标量量化，也就是对每个参数独立地进行量化，然后通过组合确定参数集。另一种是矢量量化(VQ-vector quantization),也就是将所有参数组合起来作为一个整体进行量化，在数学上就用矢量来表示参数的组合。所有可能的参数组合对应为一个有限的矢量空间，这一矢量空间的形成已经考虑了各参数之间的线性或非线性相关性以及它们的联合概率密度函数。矢量量化就是在这缩减的矢量空间中按某一判据选取最佳的矢量（参数组合量化值），显然它的效率要比标量量化高。

矢量量化的核心部件就是码本(codebook)。码本包含的矢量数称为码本尺寸，记作L；每个矢量包含的比特数称为码本的维数，记作k。显然有：L=2^k。设每个矢量记录了P个参数的量化值，平均每个参数分配到的比特称之为量化比特率，记作R。则有：R=k/P。被星化的参数可以是话音抽样值、线性预测系数、激励脉冲等。

记连续参数空间为X，离散的码本矢量空间为C，矢量量化就是完成X-->C的映射过程。设待量化的参数为X=[x₁,x₂,,......x_p]^T，搜索码本确定最佳匹配的矢量为C_i，则有：

式中，D为点X和C之间的度量距离，该距离的不同定义就决定了不同的量化判据。目前大多数矢量量化器采用的都是欧儿里得平方距离或加权的平方距离。另一种方法是直接穷尽搜索码本空间，按某种判据，如残差信号均方差最小的原则确定最佳矢昼，它将参数计算和量化综合在一起完成，随机激励信号的生成可以采用这种方法。

在矢量量化中，编码器和解码器中存有完全相同的码本。编码器选定最佳匹配矢量C_i后，只需将其在码本中的下标i传送到解码器，后者根据下标就可找出对应的矢星，从而恢复为原来的参数。其过程如图4.5所示。

图4.5 矢量量化过程示意图

为了降低话音编码器的复杂度、比特率和所需存储量，人们提出了许多种不同的码本结构，据此可将矢量量化划分成如下几种类型：

(1)全码本矢量量化

这是最简单的一种矢量量化方法，它只有一个总的码本，量化时需要对码本中的所有矢量进行搜索，找出和输入矢量X最靠近的码本矢量Y_i。可记作Y_i=q(X)，式中q(·)表示量化函数，即x→Y的映射关系。这种方法的两个最大缺点是存储量大，计算复杂。例如在线性预测时要得到可接受的失真度，需要一个20比特的码本。它包含100万个矢量，实时搜索这样大的码本是不现实的。

(2)分割码本矢量量化(Split VQ)

这种方法将待蜇化的矢量分割成两个或多个子矢星，然后对每个子矢最独立进行晕化，每个子矢量量化有它自己的码本。最后的星化结果为选定的各子码本矢量之和。在搜索第1个码本时，和全码本法一样，没有任何约束。搜索后续码本时，必须考虑前面已确定的子矢量，要保证输入矢呈的单调性。例如在2分割矢量量化中，量

化过程为YI_i=qI(XI),Y2_j=q2(X2)，在进行q₂搜索时，必须保证矢量Y2_j和Yl_i组合后误差判据将单调下降。

码本分割后，各子码本的尺寸呈指数关系下降，而顺序搜索各子码本的计算量则是各子码本搜索量的线性和，因此分割量化的计算复杂度将大为简化。另外，根据重要程度的不同，各子码本的大小可不相同。例如话音的低频成份对质量影响较大，则可以对此部分星化多分配一些比特。

(3)多级矢量量化

这种方法的思路是分阶段量化。先对输入矢量X进行颗粒度较粗的量化，对应的码本只需包含较少数量的矢量，记作YI=ql(X)，其误差矢量为W=(X-YI)。然后再用另一个码本进行细量化，进一步减小戴化误差，记作Z=q2(W)。原则上可以进行更多级的量化。

(4)自适应矢量量化

这种方法的码本内容是不断在更新的。如果在一段时间内，某些低概率码本矢量一直未被使用，则可将它们从码本中去除，然后代之以高概率矢量。这些高概率矢量取自于当前输入数据，且未被包含在现有的码本中。这些更新的码矢可以在静音期或话音数据量低的时期发送给接收方。还有一种较为实用的方法是，编码器和解码器按照同样的原则更新码本，无需传送码本更新信息，犹如反馈型自适应方法无需传送预测系数一样。下面所述的基音预测就是基于浊音信号的周期性采用了自适应矢量量化。

除此以外，还有有限状态矢量量化、可变维数矢量量化等，这些技术正在研究，但应用尚不多。

矢量量化另一个重要的问题是如何建立码本，它应该忠实地反映实际参数的组合情况。为此，需建立一个数据库，例如不同发话者不同音素的发音数据，通过模拟确定合适的码本矢量。这一过程称为码本训练过程。

在码本激励信号情况下，每个码本矢量描述一帧或一个子帧中的激励信号，可以为多脉冲表示或规则脉冲表示。码本矢量的结构关系到码本搜索的效率，一种有效的结构是将激励信号表示为有限个预定位置的单位增益脉冲，称之为代数码本。采用码本激励的线性预测合成分析编码器就称为CELP编码器。

4.基音预测和自适应码本

由于浊音的激励信号具有明显的周期性，相邻子帧的激励信号有很大的相关性，因此理想的方法应该是将上一子帧的激励信号作为初始估值，然后在此基础上附加增量信号，构成本子帧的激励信号。显然增量信号功率小得多，量化空间显著减小，可以有效地提高搜索效率。这就是基音预测机理，它利用了话音信号内在的长期相关性。

基音预测有两种实现方法。一是和短时相关一样，采用线性预测合成滤波器，其传递函数为：

式中，β为预测系数，D为预测器时延，为基音周期的逼近值。在LPAS编码器中，D通常由合成分析过程求得，也就是对所有允许的时延值求得重构话音信号，和原信号最接近的重构信号对应的时延选定为预测器时延。这一方法适用于标量量化。

对于矢量量化，码本划分为两个。一个称为自适应码本，其矢量为以前若干子帧的激励信号，其内容随时间推移不断更新。另一个称为固定码本，其矢量为随机激励，对应为增量信号。激励信号生成时，首先搜索确定自适应码本矢量，然后再搜索确定固定码本矢量，在搜索固定码本时必需考虑自适应码本矢量的响应分量。自适应码本矢措和固定码本矢量之和即为所求的激励信号。由于两个码本的尺寸远小于未采用基音预测的单码本尺寸，因此搜索效率将大大提高。