声纹鉴定与自动识别技术研究项目是由公安部物证鉴定中心等单位完成,其主要研究成果是将声纹自动识别功能植入VS99语音工作站,该系统能对说话人特征进行自动分析、判定和语图显示及丈量,并可结合专家鉴定以确定说话人身份,适合于法庭科学实际应用。项目研制出当前声纹鉴定工作中非常实用的集声谱仪和说话人自动识别系统为一体的语音工作站,大大提高了结论的正确率,为声纹鉴定提供了一个实用系统。
首先,噪声对检修结果的影响是不可忽视。在本系统中对于非平稳噪声,研究职员提出了利用偶数帧段主分量特征输入隐马尔可夫模型(HMM)结合时间方向平滑处理的SS方法来进步噪声环境下汉语连续语音识别系统鲁棒性的方法,取得较好的识别结果。
端点检测可以避免由噪音引起的误动作以及由噪音引起的误识别,对于正确检测语音信号的起始、识别系统精度等有重要意义。采用传统的语音端点检测器SAD很轻易造成语音激活的漏检。另外,较大的干扰信号,又有可能被当成是语音的激活,造成语音激活的虚检。为克服这一缺点,研究职员采用一种基于相关性的语音激活检测器,定义了一种有效的相关函数,找到了判别门限设定方法以及防止漏检和虚检的方法。
本系统采用的是基于GMM模型的优化算法。实验中发现EM算法存在泛起奇特阵的重大缺陷,而最大估计(ML),固然识别率比较低,但不会泛起奇特阵。因此研究职员采用最大似然估计(ML)所得模型为初始模型,然后用EM算法中的每步的模型通过α值控制修正比例对其进行修正,称为改进EM算法。
研究职员对传统的遗传算法进行了改进,用于GMM的参数优化中,大大进步了模型的优化程度。研究职员提出了一种新的优化的基于GMM的说话人识别方案,该方案通过先对一次发音对应一个模型的各帧似然度做一种特定变化然后再计算该音节总的似然度,也就是该音节对模型的总的评分,记作Sc,与最大Sc所属模型相对应的说话人即为目标说话人。
目前,公安部物证鉴定中央完成的国家“九五”攻关成果VS99语音工作站已经在海内普及,在实际办案中施展了重要作用。该项目是在VS99的基础上增加自动判别功能,从而进一步提高办案效率和鉴定的正确率。该项目研制的声纹鉴定自动识别系统具有完全自主知识产权,实用性强,非常适合公安工作的实际需要,可在侦查中对大量嫌疑人进行排查,可以有效地提供侦查方向,缩小侦查范围,提高工作效率。同时该系统具有语图实时显示功能,合用于步履技术中语音信号的采集。自2002年以来,实际检修鉴定案件200起,案件类型包括刑事、经济、民事、治安案件。从结案反馈及法庭审讯结果看,正判率为100%。