主观语音质量评估POLQA和PESQ选件
主观语音质量评估视为主观评估利用数据压缩编码解码器的电信通道和网络中的音频质量开发的。在这种情况下,传统的客观音频测量和主观听觉体验不相符合。
主观语音质量评估基于听众在实验中的主观评价,并且与大多数使用在ANST音频测试的周期波形或者扫描测量方法不同。因此,主观评估结果无法以电压或者频率等物理值表达。
产品介绍
用听众的语音质量意见取平均值并评分
MOS |
质量 |
杂音 |
5 |
非常好 |
感知不到失真 |
4 |
好 |
能感知到失真但不反感 |
3 |
一般 |
能感知到失真但稍微反感 |
2 |
不好 |
能感知到失真且反感 |
1 |
差 |
能感知到失真且非常反感 |
多年来,国际电信联盟和其他种族携手拟制方法和建议,利用设备测试从感知上评估通信通道的语音质量,从而提供可比较人类听众报告结果的MOS语音评估以及其他结果以供其他原因分析。
POLQA与PESQ均无需大量听众即可生成MOS语音评估结果,将预录的语音样本通过被测设备(DUT ), 并与原语音样本比较。算法评估参考音频和劣化音频之间的差异并生成结果。
ANST采用两大最新建议书POLQA和PESQ,提供适用于8192D电声综合测试仪的语音感知音频评估测量法。2001 年PESQ获批成为ITU-T(国际电信联盟电信标准化部门)推荐方法,至今仍在使用中。POLQA于2011年获国际电信联盟电信标准化部门批准并于2014年修订,较PESQ有很多改进。
通过特殊蓝牙"“配置、电话网络、网络电话( VolP )连接和其他依靠有损语音的编解码器的通道的语音非常适用于感知音频评估,正如包括声学传感器和声空间的信号通路。
POLQA和PESQ如何选择
本技术说明主要介绍POLQA,这是目前推荐使用的一种感知音频测量模型。为兼容传统设备、法规要求,部分用户可能需要使用PESQ。
以下简单对比了POLQA与PESQ:
POLQA弥补了PESQ模型的缺点,可以处理频带更宽的音频信号。其他改进还可以处理时间呼叫信号和含延迟变化的信号。
PESQ支持涵盖公用通话频带的窄频带测量(8kS/s采样率,300- 3400 Hz)和涵盖更广范围的宽频带测量(16kS/s采样率,100- -7000Hz )。
POLQA增加了超宽频带模式( 48 kS/s采样率,50--14000Hz),以调节最新的高清语音编解码器和网络。国际电信联盟电信标准化部门的一项评估表明POLQA在窄频带和宽频带模式下表现均超越PESQ。
POLQA能更精确地评测电平差(与主观听感相比)。
POLQA根据人类感知衡量线性频率失真,而PESQ往往对此类失算不敏感。
PESQ对转换器之间的钟差比较敏感,而POLQA可以补偿钟差和其他时间效应。
POLQA全面支持声学测量,包括在模拟头部和躯干、模拟人嘴和模拟人耳上使用听筒和换能器进行测试。