Compare Plans

线性预测合成分析编码原理

更新时间:2024-10-14

     4.1.1   结构原理

G.728、G.729和G.723.1都属于同一类声码器,称之为线性预测合成分析(LPAS-Linear Predicfion Analysis-by-Synthesis)编码器,其原理结构如图4.1所示。

1-211103163K2435.png

图4.1  LPAS声码器的原理结构

激励生成器产生的激励信号经线性预测器后得到重构的话音信号s(i),线性预测器模拟声道特性,加强激励信号的某些频率域,减弱另一些频率域,体现了话音的短时相关性。激励信号则体现了话音的长时相关性,输入线性预测器的激励信号是量化后的增益和基音信号。由于卧化误差的影响,重构信号和输入信号S(i)之间必然存在有限的差值e(i),称之为残差信号(residual signal),最小化过程的日的就是调整激励信号,使残差的方差为最小,由此构成确定激励信号的闭环回路。为了减小量化比特,提高编码效率,激励生成器输出的是残差信号估值,而不是原信号估值。从频域上来说,最小化过程使激励信号晕化噪声的能量集中在预测滤波器的低谷部分,从而使雇化噪声呈现平坦的类似白噪声的功率频谱。

经过最小化过程确定的激励信号星化值就是声码器的输出,接收端的解码器根据此信号和同样的线性预测器恢复原来的话音伈号(实际上图4.1.1难框部分所示闭环回路的下半部分就是解码器的结构,因此该结构的编码器己内含解码器。在话音编码中,常称编码过程为语音分析,它的功能是将话音转换为适于计算机存储和网络中传输的数字形式;称解码过程为语音合成,它的功能是将数字形式的话音数据重新转换为可供人类使用的信号形式。按这样的术语来解释,反馈回路中的线性预测器是用来重建信号的,又称为预测合成器,整个编码器是通过内含的语音合成来完成语音分析过程的,所以称之为合成分析器。

由于声道的形状和大小是随音素而变化的,因此预测合成器是一个线性时变系统,其滤波器系数需定期更新。因此,LPAS的闭环回路实际上包含两层反馈控制。内层是线性预测滤波器的自适应控制,其过程和ADPCM相同,系数更新周期为一个帧长,典型值为10~30ms。外层是激励信号的优化,由于基音周期小于帧长,因此其更新周期较短,典型值为5~l0ms。LPAS的关键技术是如何确定和量化激励信号。

残差激励信号的量化有多种方法,它是不同LPAS系统的主要差别所在。一种广为使用的方法称之为多脉冲激励(MPE-multi-pulse excitation)编码,该方法用于比特率为l0kbit/s左右的话音编码器,其复杂度适中,有良好的话音质量。与此类似的一种方法称为规则脉冲激励(RPE-regular pulse excitation)编码,该方法限定激励脉冲的位置,复杂度较低,其比特率及质量和多脉冲编码类似。近年来得到广泛使用的方法是码本激励线性预测(CELP-Code-excitedlinear Predic­tion)编码,该方法采用矢量量化技术,用予定义的码本(codebook)激励替代脉冲激励,码本中的每一个向量对应一个量化信号,编码信息转化为码本索引。这种方法具有很高的编码效率,但是复杂度也很高,由于近年来高速DSP的出现才使这种方法成为实用,并以此为基础演绎出多种低比特率声码器标准。

4.1.2   功能结构改进

图4.2为实际采用的改进结构,它增加了两个功能。

1.误差加权滤波器

前已述及,通过最小化残差信号方差的判据确定的量化误差具有平坦的噪音频谱,但是实际上人的听觉系统对于不同频段噪声的感觉是不一样的。众所周知,如果有一个强信号存在,一个本来可以听到的话音可能会被掩没成为不可闻信号,这一感觉效应称为掩蔽(masking)。误差加权滤波器的作用就是对残差信号进行频谱掩蔽,也就是按照话音信号频谱的峰值来整形量化噪声,使得量化噪声的能量集中在原信号的高能区域。插入加权滤波器后,编码器参数将根据感觉加权均方差准则选取,由此得到的量化噪声也许会增加,但是对于人的听觉系统来说可感的噪声却降低了,可以有效地提高LPAS编码器的性能。

与此类似,在解码器的输出端也可加入一个自适应后置滤波器,以进一步降低可感噪声,特别是低能量频率区域的噪声。其原理和编码器中的误差加权滤波器相似,具体实现可为短时相关滤波器和长时相关滤波器的组合。短时滤波器根据收到的预测合成器系数修改重建信号的频谱包络,长时滤波器参数则由收到的激励信号数据导出。

2.输入信号预处理

其目的也是修正误差判据,使其更加符合人类听觉系统的感觉特性,以便降低编码参数的比特率。对于最小均方差判据来说,原信号和重构信号之间微小的时延差,即相位不匹配会造成很大的失配误差,但是实际上这类误差是感觉不到的,即使时延差随时间缓慢变化,人类听觉系统对此也不敏感。输入信号予处理的作用就是对信号进行简单的时延处理或较为复杂的时间变换处理,以掩蔽相位误差。它可以有效地提高基音预测的编码效率。

1-211103164205104.png

图4.2    LPAS声码器的改进结构

下一篇

线性预测技术

通信知识

线性预测技术

LPAS结构的内核是合成滤波器,它描述了话音号信的短时相关性。如图4.1所示,其输入为激励信号,输出为重构话音信号。编码器按块处理方式工作。在每一时间块中,大量的激励信号试验通过合成滤波器,由此选定产生失真最小的激励信号作为编码参数送出。原则上可有多种方法实现该合成滤波器。一种方法是倒谱分析(cepstralanalysis),也就是用DFT和IDFT导出信号的基音周期和共振峰频率,可以很好地用于 ...

相关内容

语音合成TTS(技术原理、应用场景和发展趋势)

语音合成TTS(技术原理、应用场景和发展趋势)

一、技术原理语音合成(Text-to-Speech,TTS)是一种将文字转化为语......

通信知识

2023-12-22

免费在线文字转语音(超全免费语音合成工具推荐)

免费在线文字转语音(超全免费语音合成工具推荐)

随着科技的不断发展,语音技术也越来越普及。在日常生活中,我们经常需要用到语音技术......

通信知识

2023-08-29

免费文字转语音网站(在线语音合成工具推荐)

免费文字转语音网站(在线语音合成工具推荐)

作为免费文字转语音网站相关领域的专家,我将分享一些我的个人经验和见解,希望能对您......

通信知识

2023-07-06

查看
目录