欢迎访问深圳唯创知音电子有限公司官网!| 全国统一服务热线:4008-122-919

语音识别技术的发展及应用难点解析

发布时间:2023-03-15 10:25 浏览次数:

      语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。


语音识别方案


传统的硬件语音识别系统通过麦克风阵列进行收音,然后将原始声音信号转化为数字信号传输到计算机中处理。这样做最大优点就是成本低、体积小。对于传统的硬件语音识别系统来说,主要面临着两个问题:首先是噪音环境下效果不佳;其次是语音识别效果受环境因素影响较大。为了解决上述问题,研究者们尝试了很多种方法,主要有基于声学模型和语音识别模型的两大类。

声学模型通常是用音素、语音单元等不同的声学参数来表示不同的语音信息,其中包括对基音、频率、时长和速度等特征的描述。

而随着深度学习算法的出现,更多学者开始尝试采用深度神经网络算法进行语音识别。但是缺点也很明显,深度学习算法在语音识别领域的应用主要包括以下几个方面:

(1)语音增强:针对噪声环境下的语音识别问题,通过端点检测等技术提取到不同信噪比环境下的特征向量,然后将特征向量输入到深度神经网络中训练,最终得到一个比较好的降噪性能。

(2)语音识别:这里主要指针对特定语种进行的实时文本语音识别问题,其原理是在网络中构建一个多层卷积神经网络(CNN)模型,将输入的音频流分解为多个特征向量,然后利用这些特征向量和训练好的模型进行训练并输出一个更优结果。

(3)语音检索:其原理是将文本语音序列进行分词并分别与预设分类库中的关键词进行匹配。


语音芯片_语音芯片厂家_录音IC_语音识别方案-唯创知音

Copyright (©) 2020 深圳唯创知音电子有限公司 版权所有  地址:深圳市宝安区福永街道大洋路90号中粮福安机器人智造产业园6栋2/3层 备案号:粤ICP备15026214号