语音转换系统
文章来源:更新时间:2015/6/7
内容简介(成果内容简介、技术或产品指标约300-600字)
本研究团队所做的工作是:
1)将贝叶斯先验引入传统的基于高斯混合模型的转换方法,对转换系数设定合适的先验信息,避免了传统模型在训练数据较少的情况下容易出现过拟合的问题。使得语音转换系统的性能更加稳定,转换误差更小。在该方法中提出了两种对转换模型噪声的建模方法:一种叫single-noise,另一种叫multi-noise,前一种假设噪声服从高斯分布,后一种假设噪声服从GMM分布,实验结果表明这两种方法效果大致相当,后者在混合数较大的时候会略好于前者。
2)将核特征引入语音转换模型,将原始的低维特征映射到高维空间,使得转换模型在训练阶段能更好的对语音特征的非线性进行建模。同时该方法也能在一定程度上避免模型的过拟合问题,而且较之传统的方法,有更小的转换误差。
本技术主要优势:
1)引入转换系数的先验知识,减小传统语音转换方法的过拟合问题;
2)获得比传统转换方法更小的谱转换误差;
3)对于训练数据较少的情况下,有比较稳定的转换性能;
4)引入核特征,增强模型的非线性建模能力,提高系统性能。
成果市场前景(限200字)
本技术市场需求迫切,前景广阔,技术应用领域广泛,基于此项成熟稳定的技术可以开发出不同类型的多种应用产品,经济效益显著。且此项成果具有原创性,从而使得基于此项成果进行的产品开发能保持持续性,保障了相关开发产品企业的技术独立性,维护企业的核心利益。