基于民航陆空对话的语音识别关键技术研究

日期:2017.11.08 点击数:894

【类型】学位论文

【作者】张志辉 

【关键词】 受限制玻尔兹曼机,声学模型,深度学习,民航陆空对话,语音识别

【摘要】民航陆空对话语音指令的正确识别一直是确保航空器飞行安全的关键问题。近年来,由陆空对话问题导致的民航安全事故时有发生,给民航安全带来严重威胁。因此如何在现有条件下探索降低陆空对话风险的新方法,保障陆空对话指令的正确传输,成为一个有待解决的重要问题。近年来,语音识别技术一直是模式识别领域的研究热点并被广泛应用于诸多领域。本文通过对民航陆空对话的应用场景和特点进行分析,将语音识别技术应用到民航陆空对话领域,并结合深度神经网络(DNN)来解决民航陆空对话语音识别中的关键技术问题。为解决陆空对话的噪声问题,本文以真实的陆空对话为实验数据,对比了四种不同的降噪处理方法。实验结果表明,在该语料库下改进的谱减算法具有更好的降噪效果。在搭建语音识别系统的过程中,本文使用的语料库是以飞行员和管制员日常陆空对话的内容为蓝本,聘请管制专业人员录制的。使用该语料库分别搭建GMM-HMM单音素和三音素模型,并将三音素模型改进的结果作为DNN-HMM模型训练的标签,成功搭建DNN-HMM的声学模型。实验结果表明,DNN-HMM模型较GMM-HMM模型在基于民航陆空对话数据的音素识别中具有更强的建模能力。

【学位名称】硕士

【学位授予单位】中国民航大学

【学位授予年度】2017

【导师姓名】杨金锋;张德馨

【读秀链接】读秀链接

3 0
Rss订阅