快商通声纹识别 (厦门快商通科技股份有限公司) 产品介绍_怎么样

商品详情

商品亮点

a.识别速度快：独创的1:N大规模声纹库检索技术，在10亿级别声纹数量下，平均检索速度小于3秒；短语音处理速度＜0.1秒；
b.业界领先的精度：在信噪比低于10dB(较大噪声)情况下，识别率仍然≥95%，安静环境下≥99.6%；
c.强悍的适应性：环境音降噪功能，对于声音的变化，如音调、语速、情感等算法都具备良好的适应性；

商品说明

版本: V1.2	交付方式: API
适用于: 其他	上架日期: 2020-05-07

快商通声纹识别API服务，提供声纹识别基本算法与声纹管理功能，后台是由快商通自主研发的强大的声纹算法引擎。包含的功能主要包括：
1、声纹库的创建与查看
2、声纹的注册、查看和删除
3、说话人1:1验证（Speaker Verification）
4、声纹1:1比对（Voiceprint Compare）
5、说话人1:N辨认（Speaker Identification）

快商通声纹识别支持两种语音文本类型：
1、文本无关（ti: text-independent）
     声纹注册、声纹验证、声纹辨认，语音内容所读文本不同。文本无关对语音有时长要求，在注册场景，需要有效时长大于30秒的语音，而且验证和辨认场景，需要有效时长大于15秒的语音。文本无关适用于交谈对话，或按照一定范文朗读产生的长语音。
2、文本相关（td: text-dependent）
    声纹注册、声纹验证、声纹辨认，语音内容所读文本一致（例如注册与验证，辨认所用语音文本皆为“芝麻开门”）。在注册场景需要朗读3遍以上相同文本内容的语音用来注册声纹模型。

快商通声纹识别要求语音文件格式要求：
    格式支持：pcm（不压缩）、wav（不压缩，pcm编码）、mp3（压缩格式）。推荐wav。
    采样率：8000 Hz 或 16000 Hz 固定值。
    编码：16 bit 位深。