语音转文字_魔方数据

将语音文件转换为文字,语音时长不能超过60s
了解咨询

雷达评级

A

用户规模

-

产品上线

-

语音转换文字

接口地址
http://character.market.alicloudapi.com/aip/speech
响应格式
application/json
请求方法
POST
请求参数 (Headers)
参数类型必须描述
typestring
string
语音文件格式包括pcm(不压缩)、wav、opus、speex、amr
voiceBase64string
string
语音文件base64
typestring
string
语音文件格式包括pcm(不压缩)、wav、opus、speex、amr
voiceBase64string
string
语音文件base64
请求参数 (Query)
参数类型必须描述
keystring
string
请求 AccessKey, 请在控制台中查看

产品亮点

格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。

产品说明

将要识别的语音文件,base64转码上传。格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 。

由于底层识别使用的是pcm,因此推荐直接上传pcm文件。如果上传其它格式,会在服务器端转码成pcm,调用接口的耗时会增加。

ffmpeg转码工具使用说明(后续会提供相应的接口能力)

简介

ffmpeg 的一个功能是转换不同的音频格式,其它简介请至http://ffmpeg.org/

linux 版本:http://www.ffmpeg.org/download.html#build-linux linux 静态编译版本:https://www.johnvansickle.com/ffmpeg/ windows 版本 :http://ffmpeg.zeranoe.com/builds/

ffmpeg官方文档地址:http://ffmpeg.org/ffmpeg.html

产品参数

交付方式API

售后支持范围

提供免费技术支持