开启录音文件识别

方法名

startFunAsrFileTranscriber

注意

初始化时要注意初始化类型需要设置为NativeFileTrans
识别结果在初始化回调中返回

用法

用法如下：

uniappuniappx

let params = {
  // 注意！！！不要在端侧使用长效API Key！！！
  // 注意！！！不要在端侧使用长效API Key！！！
  // 注意！！！不要在端侧使用长效API Key！！！
  // 将长效API Key硬编码在端侧代码中，会导致安全风险！！！
  // 请在自建服务端获得临时鉴权Token（有效期60s，最长可设置1800s），再下发到端侧进行使用。
  // 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
  //
  // 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
  // 临时Token(API Key)。
  apikey: AppConfig.dashApiKey,
  //音视频文件转写的URL列表，支持HTTP / HTTPS协议，单次请求最多支持100个URL。
  fileUrls: [
    "https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
    "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
    "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
  ],
  //异步请求
  asyncRequest: this.form.asyncRequest,
  //模型选择, 注意模型对应的采样率要求。
  model: this.form.model,
  //在本次语音识别中，将应用与该热词ID对应的热词信息。
  // vocabularyId:"1234567890",
  // 指定在多音轨文件中需要进行语音识别的音轨索引，以List的形式给出，
  // 例如[0]表示仅识别第一条音轨，[0, 1]表示同时识别前两条音轨。
  // channelIds:[0],
  // 指定在语音识别过程中需要处理的敏感词，并支持对不同敏感词设置不同的处理方式。
  // 若未传入该参数，系统将启用系统内置的敏感词过滤逻辑
  //替换成空的敏感词
  // filterWithEmpty: ['开始', '发送'],
  //替换成*的敏感词
  // filterWithSigned: ['测试'],
  // 自动说话人分离，默认关闭。
  // 仅适用于单声道音频，多声道音频不支持说话人分离。
  // 启用该功能后，识别结果中将显示speaker_id字段，用于区分不同说话人。
  // diarizationEnabled: true,
  // 说话人数量参考值。取值范围为2至100的整数（包含2和100）。
  // 开启说话人分离功能后（diarization_enabled设置为true）生效。
  // 默认自动判断说话人数量，如果配置此项，只能辅助算法尽量输出指定人数，无法保证一定会输出此人数。
  // speakerCount: 2,
  //若文档中不包含某些参数，但是此功能支持这个参数，可以用如下万能接口设置参数
  // extendConfig: {
  //   custom_test: true
  // },

};
module.startFunAsrFileTranscriber({
  params: params,
  //成功执行的函数
  success: (res) => {
    console.log(res)
  },
  //失败执行的函数
  fail: (res) => {
    console.log(res)
  },
  //接口调用完成返回函数，不管成功还是失败都会返回
  complete: (res) => {
    console.log(res)
  }
})

module.startFunAsrFileTranscriber({
  params: {
    // 注意！！！不要在端侧使用长效API Key！！！
    // 注意！！！不要在端侧使用长效API Key！！！
    // 注意！！！不要在端侧使用长效API Key！！！
    // 将长效API Key硬编码在端侧代码中，会导致安全风险！！！
    // 请在自建服务端获得临时鉴权Token（有效期60s，最长可设置1800s），再下发到端侧进行使用。
    // 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
    //
    // 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
    // 临时Token(API Key)。
    apikey: AppConfig.dashApiKey,
    //音视频文件转写的URL列表，支持HTTP / HTTPS协议，单次请求最多支持100个URL。
    fileUrls: [
      "https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
      "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
      "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
    ],
    //异步请求
    asyncRequest: asyncRequest.value,
    //模型选择, 注意模型对应的采样率要求。
    model: model.value,
    //在本次语音识别中，将应用与该热词ID对应的热词信息。
    // vocabularyId:"1234567890",
    // 指定在多音轨文件中需要进行语音识别的音轨索引，以List的形式给出，
    // 例如[0]表示仅识别第一条音轨，[0, 1]表示同时识别前两条音轨。
    // channelIds:[0],
    // 指定在语音识别过程中需要处理的敏感词，并支持对不同敏感词设置不同的处理方式。
    // 若未传入该参数，系统将启用系统内置的敏感词过滤逻辑
    //替换成空的敏感词
    // filterWithEmpty: ['开始', '发送'],
    //替换成*的敏感词
    // filterWithSigned: ['测试'],
    // 自动说话人分离，默认关闭。
    // 仅适用于单声道音频，多声道音频不支持说话人分离。
    // 启用该功能后，识别结果中将显示speaker_id字段，用于区分不同说话人。
    // diarizationEnabled: true,
    // 说话人数量参考值。取值范围为2至100的整数（包含2和100）。
    // 开启说话人分离功能后（diarization_enabled设置为true）生效。
    // 默认自动判断说话人数量，如果配置此项，只能辅助算法尽量输出指定人数，无法保证一定会输出此人数。
    // speakerCount: 2,
    //若文档中不包含某些参数，但是此功能支持这个参数，可以用如下万能接口设置参数
    // extendConfig: {
    //   custom_test: true
    // },
  },
  //成功执行的函数
  success: (res) => {
    console.log(res)
  },
  //失败执行的函数
  fail: (res) => {
    console.log(res)
  },
  //接口调用完成返回函数，不管成功还是失败都会返回
  // complete: (res) => {
  //   console.log(res)
  // }
} as LevenOptions)

参数说明

参数名	参数类型	是否必填	默认值	参数描述
params	Object	是	无	接口请求参数
params.apikey	String	是	无	临时Token
params.fileUrls	Array[String]	是	无	音视频文件转写的URL列表，支持HTTP / HTTPS协议，单次请求最多支持100个URL
params.asyncRequest	Boolean	否	无	异步请求
params.model	String	否	无	模型选择, 注意模型对应的采样率要求
params.vocabularyId	String	否	无	定制泛热词ID
params.channelIds	Array[Integer]	否	无	指定在多音轨文件中需要进行语音识别的音轨索引，以List的形式给出,例如[0]表示仅识别第一条音轨，[0, 1]表示同时识别前两条音轨
params.filterWithEmpty	Array[String]	否	无	替换成空的敏感词
params.filterWithSigned	Array[String]	否	无	替换成*的敏感词
params.diarizationEnabled	Boolean	否	无	自动说话人分离，默认关闭
params.speakerCount	Integer	否	无	说话人数量参考值。取值范围为2至100的整数（包含2和100）
params.extendConfig	Object	否	无	若需要设置交互协议支持但是接口说明中未说明的参数，可通过此万能设置接口进行配置。具体设置方法请见代码示例
success	Function	否	无	执行成功的函数
fail	Function	否	无	执行失败的函数
complete	Function	否	无	执行完成的函数，不管成功还是失败都会执行

回调

示例

json

{
    "data": {},
    "message": "",
    "code": 0
}

回调说明：
参数名参数类型参数描述
message String 消息提示
data Object 数据对象
code Integer 返回类型，0.成功，其他：失败

语音识别

实时转写/实时识别

一句话识别

文件极速识别

语音合成

流式语音合成

语音合成

Gummy

Paraformer

FunAsr

Sambert

CosyVoice

开启录音文件识别

方法名

用法

回调

参数名	参数类型	参数描述
message	String	消息提示
data	Object	数据对象
code	Integer	返回类型，0.成功，其他：失败

实时转写/实时识别

一句话识别

文件极速识别

流式语音合成

语音合成

开启录音文件识别 ​

方法名 ​

用法 ​

回调 ​

开启录音文件识别

方法名

用法

回调