您当前所在位置:首页 > 论文 > 计算机论文 > 其它计算机论文

基于说话人聚类的说话人自适应

编辑:

2014-02-24

最大似然线性回归法(Maximum Likelihood Linear Regression, MLLR)是一种基于变换的方法,它采用一组变换描述从初始模型到说话人自适应(Speaker Adaptation, SA)后模型的变换关系,另外MLLR还能对不同的信道及附加噪声有一定补偿作用。一般认为不同说话人之间的差异主要表现在均值矢量上,式(6)为均值转换的估计式。

(6)

其中 是混合成份s的转移矩阵, 是自适应后的均值后的均值向量, 是混合成分s的扩展均值向量,其定义如下:

(7)

3 模型间的差别度量

可以将一个GMM的参数看作一组语音特征,考察这组特征在另一个GMM中的输出概率。用输出概率来衡量两个模型间的距离[4]。

其方法如下:把GMMA的M个混元的均值向量当作M个观测向量,计算这M个观测矢量在GMMB下的概率。类似地,计算GMMB的M个混元的均值向量在GMMA下的概率。

总结:基于说话人聚类的说话人自适应到这里就全部结束了。

相关推荐:

心理学论文:浅谈竞赛中运动员的心理障碍与心理训练

心理学论文:浅谈职业院校心理健康教育教师素养构成与发展策略

免责声明

精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处,版权归原作者及原网站所有,如果您对本站信息资源版权的归属问题存有异议,请您致信qinquan#51edu.com(将#换成@),我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。