Skip to content

开启录音文件识别

方法名

startFunAsrFileTranscriber

注意

  • 初始化时要注意初始化类型需要设置为NativeFileTrans
  • 识别结果在初始化回调中返回

用法

  • 用法如下:
js
let params = {
  // 注意!!!不要在端侧使用长效API Key!!!
  // 注意!!!不要在端侧使用长效API Key!!!
  // 注意!!!不要在端侧使用长效API Key!!!
  // 将长效API Key硬编码在端侧代码中,会导致安全风险!!!
  // 请在自建服务端获得临时鉴权Token(有效期60s,最长可设置1800s),再下发到端侧进行使用。
  // 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
  //
  // 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
  // 临时Token(API Key)。
  apikey: AppConfig.dashApiKey,
  //音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL。
  fileUrls: [
    "https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
    "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
    "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
  ],
  //异步请求
  asyncRequest: this.form.asyncRequest,
  //模型选择, 注意模型对应的采样率要求。
  model: this.form.model,
  //在本次语音识别中,将应用与该热词ID对应的热词信息。
  // vocabularyId:"1234567890",
  // 指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,
  // 例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨。
  // channelIds:[0],
  // 指定在语音识别过程中需要处理的敏感词,并支持对不同敏感词设置不同的处理方式。
  // 若未传入该参数,系统将启用系统内置的敏感词过滤逻辑
  //替换成空的敏感词
  // filterWithEmpty: ['开始', '发送'],
  //替换成*的敏感词
  // filterWithSigned: ['测试'],
  // 自动说话人分离,默认关闭。
  // 仅适用于单声道音频,多声道音频不支持说话人分离。
  // 启用该功能后,识别结果中将显示speaker_id字段,用于区分不同说话人。
  // diarizationEnabled: true,
  // 说话人数量参考值。取值范围为2至100的整数(包含2和100)。
  // 开启说话人分离功能后(diarization_enabled设置为true)生效。
  // 默认自动判断说话人数量,如果配置此项,只能辅助算法尽量输出指定人数,无法保证一定会输出此人数。
  // speakerCount: 2,
  //若文档中不包含某些参数,但是此功能支持这个参数,可以用如下万能接口设置参数
  // extendConfig: {
  //   custom_test: true
  // },

};
module.startFunAsrFileTranscriber({
  params: params,
  //成功执行的函数
  success: (res) => {
    console.log(res)
  },
  //失败执行的函数
  fail: (res) => {
    console.log(res)
  },
  //接口调用完成返回函数,不管成功还是失败都会返回
  complete: (res) => {
    console.log(res)
  }
})
js
module.startFunAsrFileTranscriber({
  params: {
    // 注意!!!不要在端侧使用长效API Key!!!
    // 注意!!!不要在端侧使用长效API Key!!!
    // 注意!!!不要在端侧使用长效API Key!!!
    // 将长效API Key硬编码在端侧代码中,会导致安全风险!!!
    // 请在自建服务端获得临时鉴权Token(有效期60s,最长可设置1800s),再下发到端侧进行使用。
    // 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
    //
    // 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
    // 临时Token(API Key)。
    apikey: AppConfig.dashApiKey,
    //音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL。
    fileUrls: [
      "https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
      "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
      "https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
    ],
    //异步请求
    asyncRequest: asyncRequest.value,
    //模型选择, 注意模型对应的采样率要求。
    model: model.value,
    //在本次语音识别中,将应用与该热词ID对应的热词信息。
    // vocabularyId:"1234567890",
    // 指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,
    // 例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨。
    // channelIds:[0],
    // 指定在语音识别过程中需要处理的敏感词,并支持对不同敏感词设置不同的处理方式。
    // 若未传入该参数,系统将启用系统内置的敏感词过滤逻辑
    //替换成空的敏感词
    // filterWithEmpty: ['开始', '发送'],
    //替换成*的敏感词
    // filterWithSigned: ['测试'],
    // 自动说话人分离,默认关闭。
    // 仅适用于单声道音频,多声道音频不支持说话人分离。
    // 启用该功能后,识别结果中将显示speaker_id字段,用于区分不同说话人。
    // diarizationEnabled: true,
    // 说话人数量参考值。取值范围为2至100的整数(包含2和100)。
    // 开启说话人分离功能后(diarization_enabled设置为true)生效。
    // 默认自动判断说话人数量,如果配置此项,只能辅助算法尽量输出指定人数,无法保证一定会输出此人数。
    // speakerCount: 2,
    //若文档中不包含某些参数,但是此功能支持这个参数,可以用如下万能接口设置参数
    // extendConfig: {
    //   custom_test: true
    // },
  },
  //成功执行的函数
  success: (res) => {
    console.log(res)
  },
  //失败执行的函数
  fail: (res) => {
    console.log(res)
  },
  //接口调用完成返回函数,不管成功还是失败都会返回
  // complete: (res) => {
  //   console.log(res)
  // }
} as LevenOptions)
  • 参数说明
    参数名参数类型是否必填默认值参数描述
    paramsObject接口请求参数
    params.apikeyString临时Token
    params.fileUrlsArray[String]音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL
    params.asyncRequestBoolean异步请求
    params.modelString模型选择, 注意模型对应的采样率要求
    params.vocabularyIdString定制泛热词ID
    params.channelIdsArray[Integer]指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨
    params.filterWithEmptyArray[String]替换成空的敏感词
    params.filterWithSignedArray[String]替换成*的敏感词
    params.diarizationEnabledBoolean自动说话人分离,默认关闭
    params.speakerCountInteger说话人数量参考值。取值范围为2至100的整数(包含2和100)
    params.extendConfigObject若需要设置交互协议支持但是接口说明中未说明的参数,可通过此万能设置接口进行配置。具体设置方法请见代码示例
    successFunction执行成功的函数
    failFunction执行失败的函数
    completeFunction执行完成的函数,不管成功还是失败都会执行

回调

  • 示例
json
{
    "data": {},
    "message": "",
    "code": 0
}
  • 回调说明:
    参数名参数类型参数描述
    messageString消息提示
    dataObject数据对象
    codeInteger返回类型,0.成功,其他:失败