机器人特定人语音识别系统判别的基本方法:确定特征,提取特征矩阵,特征矩阵相比较

2025/12/31 10:43:13 5879 
 

从机器人语音识别的难易程度和应用目的来说,可以将语音识别分为两大 类,即特定人的语音识别系统和非特定人的语音识别系统。

所谓特定人语音识别系统是指,判定说话人的声音是不是事先指定的那 个人,或者是不是事先指定的一大批人中的某一个。先要记忆一个人或者 几个人的语音特征,而且被指定的人的讲话内容也是事先规定好的有限定的 几句话。

特定人语音识别,先要找出话音的起点和终点。实验证明,为了识别 发言人的话,先要找出语音的起点和终点。为此,系统还要能够保留一段 声音信号,当发现明显的声音信号时,要从这点向前考察各个短时间段的幅度与过零度,只要其中之一超过某个限值,就认为这段还是属于发音段,直 到这两种特征都低于限值时才停止考察,这个时间点就是语音的起点。

对于 终点,也用相同的办法来判别。特定人语音识别系统判别的基本方法是: 先确定识别方法所用的特征,其次将接收到的话音提取特征矩阵,然后与事 先存储在系统之内的标准模板中的特征矩阵相比较,计算它们的距离。这个 距离可以用各个对应的特征值之差的平方和来定定义。

如果距离小于某个 值,则系统认为该发言人是指定的发言人,并确定所说的话是什么。其大致 流程如图4-18所示。

特定人语音识别系统判别的基本方法是:

①确定识别方法所用的特征;

②将接收到的话音提取特征矩阵;

③与事先存储在系统之内的标准模板中的特征矩阵相比较,计算它们的距离。这个距离可以用各个对应的特征值之差的平方和来定义。

④如果距离小于某个值,则系统认为该发言人是指定的发言人,并确定所说的话是什么。


 
上一篇   下一篇
 
返回顶部
  技术支持
  关于创泽
  隐私条款
咨询热线
 
销售咨询
4006-935-088 / 4006-937-088
 
客服热线
4008-128-728

版权所有 @ 创泽智能机器人集团股份有限公司
运营中心 / 北京市·清华科技园九号楼5层
生产中心 / 山东省日照市开发区太原路71