数字音响包含的范围很广,既包括各种数字化的原声信号,各种数字化的设备,也包括协调这些信号和设备的各种协议和标准。它涉及到声学、美学和人体生物学等诸多方面。简单的讲,数字音响是由硬件加软件构成的。

中文名

数字音响

外文名

digital audio

别名

数字音响技术

拼音

shù zì yīn xiǎng

性质

技术

特点

信噪比高失真度低

原理

音响技术是研究声音信号的转换、记录、传送和重放的专门综合性技术。数字音响技术是指在音响技术的基础上,对原声信号(合乐、声乐等)进行一系列数字处理后,再恢复成高质量的模拟声音信号的技术。数字音响技术已深入到日常生活的各个方面,从家庭影院、汽车音响到个人音乐播放器,无不体现出数字音响的优越性。伴随着信息技术的不断发展,数字音响技术不断发展和创新,其核心关键技术不断完善,使得音响行业的数字化、智能化前景美好。

从原理上来讲,数字音响技术首先应该是原声信号的数字化,其次才是音响设备的数字化。原声信号的数字化是将音频模拟信号转换成音频数字信号,进行传送或储存,然后将这些音频数码信息又还原成音频模拟信号,其间实行了两次转换,即模数转换A/D和数模转换D/A,后者现在一般由数字功率放大器完成。

而音响设备的数字化指得是为适应数字音频信号的传送或储存,对设备整体电路进行调整或改进,使之能够传递、储存或处理数字音频信号。

因此,本文从软件(原声信号的数字化方法和压缩方案及格式)和硬件(数字功率放大器)两个方面来论述数字音响技术的发展和关键技术。

数字技术

原声语音信号可以看成是模拟信号,其数字化就是将这些模拟信号进行模数转换变成数字信号。最早的原声语音信号数字化采用的是PCM(Pulse Code Modulation)技术即脉冲编码调制技术。1967年,日本NHK技术研究所首先把将通信技术中的PCM技术引进音响领域,从此标志着数字音响时代的开始。

2.1典型的原声信号数字化方法

原声信号的数字化一般从信号的波形、信号的参数等方面入手,可以分为波形编码、参数编码和混合编码等。

波形编码力图使还原出的语音波形与原语音信号波形一致,这种数字化的方法适应能力强、编码后的语音质量好,但所需的编码速率高。这类方法的典型代表有前述的脉冲编码调制(PCM)、自适应差分脉冲编码调制(Adaptive Difference Pulse CodeModulation,ADPCM)、连续可变斜率增量(ContinuouslyVariable Slope Delta,CVSD)编码调制等。其中CVSD编码由于其抗突发错误能力较强,在移动通信、军事通信和卫星通信等领域得到了广泛地应用。

参数编码的编码对象是原声信号的特征参数,通过对这些参数的提取及编码来保持原声语意,其特点是编码速率较低,合成语音质量较差,如线性预测编码(Linear Prediction Code,LPC)、多脉冲激励线性预测编码(Multi Pulse Excited Linear Prediction Code,MPELPC)等。

混合编码编码对象包括了原声信号的波形和参数,针对参数编码语音质量低的缺点,混合编码采用合成-分析的方法,能够在中低速率上获得高质量的语音编码,节省传输信道容量及存储量。其典型代表如线性预测编码(Code Excited Linear Prediction,CELP)、短时延码激励线性预测编码(Low-DelayCode Excited Linea rPrediction,LD-CELP)、矢量和激励线性预测编码(Vector Sum Code Excited Linear Prediction,VSCELP)等。

针对不同的编码方式,欧洲广播联盟和3GPP国际组织等机构组织陆续推出了EAAC+、AMR-WB+和G.729.1等编码标准,用以规范编码方法,极大促进了语音信号的数字化进程。

音频格式

由前述编码方式得到的数字音频信号一般都比较大,要降低磁盘占用,就只有降低采样指标或者进行压缩。降低指标意味着音质的降低,因此研究人员把工作重点放在数字音频信号的压缩上,陆续研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩方案所达到的音质和压缩比也不一样,因此产生了多种典型的数字音频格式。具体如下:

(1)WAV格式。WAV压缩是基于PCM编码的压缩方案。它能达到相同采样率和采样大小条件下的最好音质,在Windows平台下,所有音频软件都能够提供对它的支持,因此,WAV格式被大量用于音频编辑、非线性编辑等领域。同时,它也被作为一种中介的格式,常常使用在其他编码的相互转换之中。

(2)MP3格式。MP3格式诞生于上世纪八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。MP3具有不错的压缩比,使用LAME编码的中高码率的MP3,听感上已经非常接近源WAV文件,但其在较低码率下表现不好。总的来说,这种压缩格式音质好,压缩比比较高,被大量软件和硬件支持,应用非常广泛,是当今主流的压缩压缩编码之一。

(3)OGG格式。OGG有着出色的算法,可以用更小的存储空间和码率获得更好的音质,尤其在中低码率下表现突出。128kbps的OGG比192kbps甚至更高码率的MP3还要出色,但其高频表现一般。OGG具有流媒体的基本特征,但现在还没有媒体服务软件支持,因此基于OGG的数字广播还无法实现,其市场表现无法和MP3相提并论。可以说,OGG是一种非常有潜力的压缩编码方案。

(4)MP3PRO格式。作为MP3的改良版本的MP3PRO表现出了相当不错的素质,它采用SBR插入技术,在64kbps码率下表现极为突出,高音丰满,但其低频表现不佳。主要适用于低要求下的音乐欣赏。

(5)WMA格式。WMA就是WindowsMediaAudio编码后的文件格式,由微软开发,其研发的目的市场就是网络音频。在64kbps的码率情况下,WMA可以达到接近CD的音质。WMA支持防复制功能,可以限制播放时间和播放次数甚至于播放的机器等。WMA也支持流技术,可以一边读一边播放,因此WMA可以很轻松的实现在线广播,由于目前版本的Windows中加入了对WMA的支持,且WMA有着优秀的技术特征,这种格式被越来越多的人所接受。

(6)APE格式。APE是Monkey’s Audio提供的一种无损压缩格式,可以提供50-70%的压缩比。其压缩音质非常好,在现有不少无损压缩方案种,APE是一种有着突出性能的格式,令人满意的压缩比以及飞快的压缩速度,适用于高品质的音乐欣赏及收藏。

(7)ACC格式。AAC(AdvancedAudio Coding,高级音频编码技术)是杜比实验室为音乐社区提供的技术。AAC最大能容纳48通道的音轨,采样率达96KHz,并且在320Kbps的数据速率下能为5.1声道音乐节目提供相当于ITU-R广播的品质。和MP3比起来,它的音质比较好,也能够节省大约30%的储存空间与带宽。它是遵循MPEG-2的规格所开发的技术。

此外,还有MPC、VQF和FLAC等压缩格式,但其影响力和使用情况不如上述典型格式。

数字技术

经过二十多年的发展,音响设备的数字化已基本完成,包括音源的数字化(如CD、DVD等),音频控制装置的数字化(如数字调音台、数字效果器等)。但由于高速控制和线性稳定等技术瓶颈的制约,音响设备的核心部分)))功率放大器的数字化发展比较缓慢。因此,本文主要讨论功率放大器的数字化问题。

3.1数字功率放大器

模拟的功率放大器经过了几十年发展,在这方面的技术已经相当成熟,但始终无法解决效率、成本、音质这三个问题。从二十世纪八十年代早期开始,许多研究人员致力于开发不同类型的数字放大器,这种放大器直接从数字语音数据实现功率放大而不需要进行模拟转换,这样的放大器通常称作数字功率放大器或者D类放大器。它具有两大优点:效率很高;模拟信号转换为数字信号输入,能够很好的与数字音源播放机对接。D类功放的效率高达80%至90%以上,且功耗较小,但是它的保真度较差。为了解决这个问题,美国Tripath Technology公司研发了一种保真度好、效率高的音频功率放大器,即T类功率放大器。其核心是/Digital Power Processing(tm)(DPP(tm))0数字功率处理技术。T类功放的动态范围更宽,响率响应平坦,群延迟小。DDP(tm)的出现,把数字时代的功率放大器推到一个新的高度。目前的绝大部分数字功率放大器均为D类功放或T类功放。

研究进展

2008年,意法半导体(ST)公司宣布,推出了一个高质量的单片音频数字功率放大器STA510F。该产品能够向8欧姆立体声负载输出最高每声道100W的功率。其特色是音质高、功耗低、制造成本低,适合目前流行的快速增长的应用产品,如无线产品、个人和家庭音频系统等。这个数字功率放大器代表了目前最先进的数字功率放大技术,它的出现,为设计低成本、高效能、外观紧凑的数字音响系统提供了可能。

此外,先锋电子于2008年12月也正式推出两款全新的多声道数字功率放大器SC-LX81及VSX-LX51,这两款数字功率放大器均具备最新HDAudio解码功能和自动声场校准技术,采用了最新全频段相位控制技术(Full BandPhase Control),能有效改善多声道扬声器的相位特性,并应用新的低音管理系统,能有效补偿重低音扬声器和主声道之间的相位延迟,达到更佳的多声道环绕效果。

伴随着数字信号处理技术、通信技术和计算机技术等信息技术的发展,音频信号的编码、压缩和解码等技术日趋先进和高效,超大规模集成电路、高性能运算芯片和大容量存储介质等电子技术的应用也将音响设备的数字化推向一个新的高度。在这些技术的支持下,数字音响技术的发展进入了一个全新的阶段,并表现出高音质、高码速、高集成、低功耗等特点。可以说,数字音响技术的发展空间巨大,发展前景光明,值得深入研究和探讨。

主要特点

1.

数字音响记录形式是二进制码, 重放时只需判断“0”或“1”。因此, 记录媒介的噪声对重放信号的信噪比几乎没有影响。而模拟音响记录形式是连续的声音信号, 在录放过程中会受到诸如磁带噪声的影响, 要叠加在声音信号上而使音质变差。尽管在模拟音响中采取了降噪措施, 但无法从根本上加以消除。

2. 失真度低

在模拟音响录放过程中, 磁头的非线性会引入失真, 为此须采取交流偏磁录音等措施, 但失真仍然存在。而在数字音响中, 磁头只工作在磁饱和及无磁两种状态, 表示1 和0, 对磁头没有线性要求。

3. 重复性好

数字音响设备经多次复印和重放, 声音质量不会劣化。传统的模拟盒式磁带录音, 每复录一次, 磁带所录的噪声都要增加, 致使每次复录要降低信噪比约3 dB, 子带不如母带, 孙带不如子带, 音质逐次劣化。

4. 抖晃率小

数字音响重放系统由于时基校正电路作用, 旋转系统, 驱动系统的不稳不会引起抖晃,因而不必要求像模拟记录中那样的精密机械系统。

5. 适应性强

数字音响所记录的是二进制码, 各种处理都可作为数值运算来进行, 并可不改变硬件, 仅用软件操作, 便于微机控制, 故适应性强。

6. 便于集成

由于数字化, 因而便于采用超大规模集成电路, 并使整机调试方便, 性能稳定, 可靠性高, 便于大批量生产, 可以降低成本。