智能语音识别技术在20世纪中的重大进展

首页 > 资讯教程 > 智能科技 > 智能家居 > 智能语音识别技术在20世纪中的重大进展

智能语音识别技术在20世纪中的重大进展

作者：075玩来源：互联网 2023-09-23 13:40:07

　　语音识别技术与其自然语言处理技术相结合，可以构建出更加复杂的应用。例如与机器翻译、语音合成技术等相结合，可以实现语音到语音的翻译等应用。

　　在语音识别的研究发展过程中，相关研究人员根据不同语言的发音特点，设计和制作了汉语、英语等各类语言的语音数据库。这些语音数据库可以为国内外有关的科研单位提供汉语连续语音识别算法研究和系统设计，也可以为产业化工作提供充分、科学的训练语音样本。

　　目前在大词汇语音识别方面处于领先地位的IBM语音研究小组，他们从20世纪70年代开始进行这些研究;同时AT&A的贝尔研究所历经1 0年研究有关非特定人语音识别的实验，确立了如何制作用于非特定人语音识别的标准模板的方法。在这一时期所取得的重大进展有以下几点。

　　① 隐马尔柯夫模型（ HMM）技术的成熟和不断完善成为语音识别的主流方法。从Baum提出相关数学推理，经过Labiner等人研究，到卡内基一梅隆大学的李开复实现第—个基于隐马尔柯夫模型的大词汇量语音识别系统Sphinx，之后的语音识别技术都和HMM技术挂钩。

　　② 以知识为基础的语音识别的研究越来越受到重视。在连续语音识别时，除了能识别声学信息外，还能利用各种语言知识，诸如构词、语义、句法、对话背景方面的知识进一步对语音作出识别和理解。

　　③ 人工神经网络在语音识别中的应用研究兴起。人工神经网络大多采用基于反向传播法（BP算法）的多层感知网络，具有区分复杂的分类边界的能力，能够帮助模式划分。由于其有着广泛的应用前景，因此成为了语音识别应用的一个热点。

　　（1）机器对语音的识别和理解：要对自然语音进行识别和理解，首先必须将连续的讲话分解为词、音素等单位，然后还要建立一个理解语义的规则。

　　（2）对信息量大的语音识别困难：语音模式不仅对不同的说话人不同，对同一说话人也是不同的，例如一个说话人在随意说话和认真说话时的语音信息是不同的;且同一个人的说话方式随着时间变化，各地方言之间也不一样，这在客观上对语音识别造成了一定的阻碍。

　　（3）对模糊性的语音识别困难：同音词为语音识别带来困扰，，就好比说话者在讲话时，不同的词可能听起来是相似的。

　　（4）语音特性受上下文影响：单个字母或词、字的语音特性受上下文的影响，单词在不同的语境中呈现不同的重音、音调、音量和发音速度，表达的意思也不同，会使语音辨识受到干扰。

　　（5）噪声、干扰的影响：环境的噪声和干扰对语音识别也有十分严重的影响，使语音识別率降低。

关键词：