Appearance
开启录音文件识别
方法名
startFunAsrFileTranscriber
注意
- 初始化时要注意初始化类型需要设置为
NativeFileTrans - 识别结果在初始化回调中返回
用法
- 用法如下:
js
let params = {
// 注意!!!不要在端侧使用长效API Key!!!
// 注意!!!不要在端侧使用长效API Key!!!
// 注意!!!不要在端侧使用长效API Key!!!
// 将长效API Key硬编码在端侧代码中,会导致安全风险!!!
// 请在自建服务端获得临时鉴权Token(有效期60s,最长可设置1800s),再下发到端侧进行使用。
// 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
//
// 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
// 临时Token(API Key)。
apikey: AppConfig.dashApiKey,
//音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL。
fileUrls: [
"https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
"https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
"https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
],
//异步请求
asyncRequest: this.form.asyncRequest,
//模型选择, 注意模型对应的采样率要求。
model: this.form.model,
//在本次语音识别中,将应用与该热词ID对应的热词信息。
// vocabularyId:"1234567890",
// 指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,
// 例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨。
// channelIds:[0],
// 指定在语音识别过程中需要处理的敏感词,并支持对不同敏感词设置不同的处理方式。
// 若未传入该参数,系统将启用系统内置的敏感词过滤逻辑
//替换成空的敏感词
// filterWithEmpty: ['开始', '发送'],
//替换成*的敏感词
// filterWithSigned: ['测试'],
// 自动说话人分离,默认关闭。
// 仅适用于单声道音频,多声道音频不支持说话人分离。
// 启用该功能后,识别结果中将显示speaker_id字段,用于区分不同说话人。
// diarizationEnabled: true,
// 说话人数量参考值。取值范围为2至100的整数(包含2和100)。
// 开启说话人分离功能后(diarization_enabled设置为true)生效。
// 默认自动判断说话人数量,如果配置此项,只能辅助算法尽量输出指定人数,无法保证一定会输出此人数。
// speakerCount: 2,
//若文档中不包含某些参数,但是此功能支持这个参数,可以用如下万能接口设置参数
// extendConfig: {
// custom_test: true
// },
};
module.startFunAsrFileTranscriber({
params: params,
//成功执行的函数
success: (res) => {
console.log(res)
},
//失败执行的函数
fail: (res) => {
console.log(res)
},
//接口调用完成返回函数,不管成功还是失败都会返回
complete: (res) => {
console.log(res)
}
})js
module.startFunAsrFileTranscriber({
params: {
// 注意!!!不要在端侧使用长效API Key!!!
// 注意!!!不要在端侧使用长效API Key!!!
// 注意!!!不要在端侧使用长效API Key!!!
// 将长效API Key硬编码在端侧代码中,会导致安全风险!!!
// 请在自建服务端获得临时鉴权Token(有效期60s,最长可设置1800s),再下发到端侧进行使用。
// 临时鉴权Token: https://help.aliyun.com/zh/model-studio/obtain-temporary-authentication-token
//
// 服务只需要在临时Token(API Key)快过期前刷新一次。各端侧在Token(API Key)快过期前从服务获得新的
// 临时Token(API Key)。
apikey: AppConfig.dashApiKey,
//音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL。
fileUrls: [
"https://gw.alipayobjects.com/os/bmw-prod/0574ee2e-f494-45a5-820f-63aee583045a.wav",
"https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/long_audio_demo_cn.mp3",
"https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/sensevoice/sample_video_poetry.mp4"
],
//异步请求
asyncRequest: asyncRequest.value,
//模型选择, 注意模型对应的采样率要求。
model: model.value,
//在本次语音识别中,将应用与该热词ID对应的热词信息。
// vocabularyId:"1234567890",
// 指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,
// 例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨。
// channelIds:[0],
// 指定在语音识别过程中需要处理的敏感词,并支持对不同敏感词设置不同的处理方式。
// 若未传入该参数,系统将启用系统内置的敏感词过滤逻辑
//替换成空的敏感词
// filterWithEmpty: ['开始', '发送'],
//替换成*的敏感词
// filterWithSigned: ['测试'],
// 自动说话人分离,默认关闭。
// 仅适用于单声道音频,多声道音频不支持说话人分离。
// 启用该功能后,识别结果中将显示speaker_id字段,用于区分不同说话人。
// diarizationEnabled: true,
// 说话人数量参考值。取值范围为2至100的整数(包含2和100)。
// 开启说话人分离功能后(diarization_enabled设置为true)生效。
// 默认自动判断说话人数量,如果配置此项,只能辅助算法尽量输出指定人数,无法保证一定会输出此人数。
// speakerCount: 2,
//若文档中不包含某些参数,但是此功能支持这个参数,可以用如下万能接口设置参数
// extendConfig: {
// custom_test: true
// },
},
//成功执行的函数
success: (res) => {
console.log(res)
},
//失败执行的函数
fail: (res) => {
console.log(res)
},
//接口调用完成返回函数,不管成功还是失败都会返回
// complete: (res) => {
// console.log(res)
// }
} as LevenOptions)- 参数说明
参数名 参数类型 是否必填 默认值 参数描述 params Object 是 无 接口请求参数 params.apikey String 是 无 临时Token params.fileUrls Array[String] 是 无 音视频文件转写的URL列表,支持HTTP / HTTPS协议,单次请求最多支持100个URL params.asyncRequest Boolean 否 无 异步请求 params.model String 否 无 模型选择, 注意模型对应的采样率要求 params.vocabularyId String 否 无 定制泛热词ID params.channelIds Array[Integer] 否 无 指定在多音轨文件中需要进行语音识别的音轨索引,以List的形式给出,例如[0]表示仅识别第一条音轨,[0, 1]表示同时识别前两条音轨 params.filterWithEmpty Array[String] 否 无 替换成空的敏感词 params.filterWithSigned Array[String] 否 无 替换成*的敏感词 params.diarizationEnabled Boolean 否 无 自动说话人分离,默认关闭 params.speakerCount Integer 否 无 说话人数量参考值。取值范围为2至100的整数(包含2和100) params.extendConfig Object 否 无 若需要设置交互协议支持但是接口说明中未说明的参数,可通过此万能设置接口进行配置。具体设置方法请见代码示例 success Function 否 无 执行成功的函数 fail Function 否 无 执行失败的函数 complete Function 否 无 执行完成的函数,不管成功还是失败都会执行
回调
- 示例
json
{
"data": {},
"message": "",
"code": 0
}- 回调说明:
参数名 参数类型 参数描述 message String 消息提示 data Object 数据对象 code Integer 返回类型,0.成功,其他:失败
