商品说明
版本:
V1.0
|
交付方式:
API
|
适用于:
其他
|
上架日期:
2019-10-11
|
声纹识别:通过数字声纹结合数字ASR有效验证人声,同时动态生成随机数字机制,可以有效抵御录音攻击,保障验证的最大安全性。声纹识别1:1、1:N识别模型,可以接入系统提供身份验证、声纹登陆、声纹打卡等用户场景,支持上传8K音频格式。
人声分离:在多人对话场景中进行精准的声纹识别,分离出单个说话人音频,并识别出每个人的说话内容。适用于公安动态布控、大型会议等应用场景。
情绪识别:
通过声纹识别辨别说话人身份并提取其声音,从而判断其情绪倾向(正面、负面、中性),可广泛应用于智能硬件行业,让用户享受个性化的服务与智能化的生活方式。
活体检测:快速提取与验证声纹,准确识别说话人身份,防范录音攻击与合成语音攻击。
性别识别:通过神经网络对声音进行分类,比对声纹特征,实时判断说话人的性别特征,识别准确率高达99%以上,并可应对各种不同口音,尤其适用于无法进行人脸识别的场合。
声纹其他说明:
(1)声纹识别可用于什么场景
声纹识别是一种经济、可靠、简便和安全的身份识别方式,语音波形反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术,在安全性上可与其他生物识别技术(指纹、掌形和虹膜)相媲美,且只需麦克风即可,数据采集极为方便,造价低廉。
声纹识别在公共安全监控,刑事侦查音谱分析,司法声纹证据,银行、互联网金融贷款身份/黑名单识别,社会保险发放身份确认,移动支付身份验证,智能硬件用户识别个性化服务等均可应用。
(2)声纹使用要点
声纹识别服务要获得期望的效果,须正确录入语音。
声纹识别的操作可分为两种:注册声纹(声音特征建模)和声纹对比。有效的声纹必须准确、纯粹、完全地反映说话人的声音特种,因此声纹录入时必须做到以下几点:
1. 说话人的有效语音时长足够,为了能让机器完全掌握声音特征,对于不同的模型,录音的有效时长有着不同的标准,详情请查看语音标准
2. 说话人语音需保持纯粹,即录入时需避免混入其他人的声音或过大的环境噪音(如喇叭声、马达声等),虽然Speakin在算法上进行了优化处理与提取,但是更加纯粹的语音录入,有助于声纹识别的准确性。
3. 说话人的讲话方式需保持正常,不可刻意进行变声、拖音、语速过度变化、声音强度过度变化等,这些行为均为导致声纹特征的改变,不利于声纹识别的准确性。