编辑:sx_yangk
2015-02-28
在提升国家普通话水平测试系统评分性能,改进系统评分机制这项研究工作中,语音识别是关键技术,而声学特征的提取与选择是语音识别的一个重要环节.以下就是由精品学习网为您提供的系统神经网络评分机制算法。
笔者提出了一种依据噪声污染情况自适应选取不同策略滤波的算法.首先判断噪声点,然后对轻度噪声污染语音采取梯度法滤波,对中度污染语音采取信号点中值滤波,对重度污染语音采取基于直方图信息的加权均值虑波.该算法在整个噪声率范围内都有效,无需设定参数,自适应能力强.但本文算法针对的是较为理想的干扰噪声模型,其噪声点为0或255,且均匀分布.如果原语音中包含很多取值为0或255的点,该算法将导致语音失真,且不能直接应用于高斯噪声和脉冲噪声点在0到255之间随机取值的语音.此外,笔者在实践中又提出一种噪声检测的有效算法:对噪声点,取所定义的12个梯度值中最小梯度对应邻域音素决定噪声点处的功率值,对信号点保持原值.实验结果表明,噪声率低于0.2,特别是在语音中存在黑、白细线时,新算法在滤除噪声的同时很好地保护了语音细节.但对严重干扰噪声污染语音,该算法中的直线检测存在局限性.在实际测试中,笔者还使用了基于开关滤波思想的算法.首先,采用改进的极值检测法检测语音噪声,建立噪声标记矩阵;然后,根据语音局部噪声污染情况自适应选择不同策略滤除噪声;最后,利用误检音素修正,极大地减少了对信号点的误滤波操作,但是实现应用较为有限.
随着语音应用环境的日趋复杂化,特别是在环境噪声和干扰对语音识别有严重影响的情况下,往往会致使语音识别率极大降低,此时滤波算法已经不能满足要求.目前来看,新的普通话测试系统优化主要有如下几方面的问题需要解决:(1).对自然语言的识别和理解.首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则.(2)语音信息量大.语音模式不仅对不同的说话人不同,对同一说话人也是不同的.(3)语音的模糊性.说话者在讲话时,不同的词可能听起来是相似的.这在英语和汉语中常见.(4)单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等.
标签:语言学
精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处,版权归原作者及原网站所有,如果您对本站信息资源版权的归属问题存有异议,请您致信qinquan#51edu.com(将#换成@),我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。