公共广播系统的语言清晰度

“对不起,我没听清。”如果听众的脑海中流过这类念头,那很可能就是扩声系统没能正常发挥作用造成的 – 不管这是在音乐厅还是火车站。对语言清晰度的测量不仅能得到有关公共广播系统当前状态的各类信息,也能为系统优化提供重要线索。

1915 12 24 日,世界上首个大型公共广播系统投入使用,为旧金山的一次公众活动放送语音和音乐。约 10 万名听众在现场感受到了清晰且易于理解的信息。有人可能会觉得,经过过去一百多年的发展,扩声系统已经优化到终极形态,糟糕的清晰度不过是上古传说,但残酷的现实却事与愿违。难以听清和让人烦燥的广播系统仍在很多场所普遍存在。想象一下您花了昂贵的票价却发现自己最爱的乐队或演出是那么嘈杂烦人,更不用说紧急情况下的提示信息如果不够清晰,不仅涉嫌违法,对人们来说也相当危险。

什么是语言清晰度?

语言清晰度描述的是语音信息经公共广播系统传播后的清晰程度和完整性。早期,人们通过人工测试的方式评估扩声系统的语言清晰度:一位朗读者在讲台上读一些没有意义的字词和音节,而听众要尽可能正确的记录听到的信息。结果以百分比形式给出,100% 是满分。1940 年代,贝尔实验室开发出首个语言清晰度的电子测量方法。ALcons(辅音音节损失)指的是辅音发音的丢失程度,用百分比来表示不能正确理解的词或辅音。ALCons 值为 0.00% 则说明传播过程中的错误为零(未丢失辅音)。

使用 NTi Audio XL2 测量语言清晰度

现代测量方法,如 STI(语言传输指数)或 STIPA(公共广播系统语言传输指数)尝试用一个单一值描述结果,将尽可能多的干扰因素考虑在内(追求现实场景)。结果是介于 0.00(无法理解)和 1.00(完美理解)之间的数值(STI)。好的扩声系统即便用在声学条件较差的环境也能达到 0.45 0.65 的结果,而在声学环境较好的场所,能达到 0.70 0.90。更直观的例子,一间优秀的录音棚内,从麦克风到监听音箱之间典型的 STI 值能达到 0.90 0.97(作者测量结果)。

语言清晰度的敌人和朋友

技术上讲,语音的调制深度或测试信号维持不变,总能得到很好的语言清晰度。在频谱和时间轴上,信号传输没有畸变和振幅遮蔽。

好的语言清晰度敌人众多,但也有强大的盟友。下面就是一些最常见的陷阱,从中我们也能看出潜在的解决方案。

房间声学是最重要的影响因素。较长的混响时间(RT60)和漫长的反射(80 150 毫秒)掩盖了语音信号,就像“堵塞物”一样阻碍信号的调制深度,让信息识别更加困难。

位置糟糕的扬声器,加上不合适的指向性则会将声音传给对面的墙壁或玻璃等,而不是直接传达给听众。这时,从扬声器直达观众的声音将比噪声(反射声,干涉声)还小,语言清晰度自然会降低。

尺寸不达标的广播系统无法盖过观众的呼喊,或者轻易被一列驶过的列车声淹没则是另一个问题。信噪比很低,语言清晰度变差。合格的公共广播系统至少要能发出超过最大背景噪声 10 15 dB 的声压级,具有自然极限(听力保护)和考虑干扰掩蔽效应。

心理声学掩蔽效应也会造成语言清晰度的丢失。不仅仅是外来的噪声会掩盖语音,语音本身也会,尤其在语音非常响时。语音中的低频成分会掩盖更安静,频率更高的声音造成它们难以听到。另一个干扰是传输通道中的线性和非线性失真。这些干扰不单由功放截断或差劲的扬声器导致,很多时候常常来自出于好意,却执行不善的信号处理过程。过多的动态压缩,过度驱动的限幅器,某些频率上不必要的推高或抑制,以及过于小气的数据压缩,都让语言清晰度变得很差。

实践中 STI 值的意义 

所以请注意!候机大厅里的音乐伴奏读物,空游泳池改造的即兴剧场,列车到达时的站台广播,所有这些场景,都需要仔细计划和大力提升技术手段以获得合理的,至少是可接受的语言清晰度。

© 2018 by Karl M. Slavik

本文版权归 vdt 杂志所有,未经授权,不得使用。

文章完整内容:下载全文

更多关于 STI 测量

vdt 杂志官方网站