语音转文字_魔方数据 (北京同城缘信息技术有限公司) 产品介绍_怎么样

语音转换文字

接口地址

http://character.market.alicloudapi.com/aip/speech

响应格式

application/json

请求方法

POST

请求参数 (Headers)

参数名	类型	必须	描述
type`string`	`string`	是	语音文件格式包括pcm（不压缩）、wav、opus、speex、amr
voiceBase64`string`	`string`	是	语音文件base64
type`string`	`string`	是	语音文件格式包括pcm（不压缩）、wav、opus、speex、amr
voiceBase64`string`	`string`	是	语音文件base64

请求参数 (Query)

参数名	类型	必须	描述
key`string`	`string`	是	请求 AccessKey, 请在控制台中查看

产品亮点

格式支持：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。推荐pcm 采样率：16000 固定值。编码：16bit 位深的单声道。

产品说明

将要识别的语音文件，base64转码上传。格式支持：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。推荐pcm 。

由于底层识别使用的是pcm，因此推荐直接上传pcm文件。如果上传其它格式，会在服务器端转码成pcm，调用接口的耗时会增加。

ffmpeg转码工具使用说明（后续会提供相应的接口能力）

简介

ffmpeg 的一个功能是转换不同的音频格式，其它简介请至http://ffmpeg.org/

linux 版本：http://www.ffmpeg.org/download.html#build-linux linux 静态编译版本：https://www.johnvansickle.com/ffmpeg/ windows 版本：http://ffmpeg.zeranoe.com/builds/

ffmpeg官方文档地址：http://ffmpeg.org/ffmpeg.html