Appearance
开始一句话识别
方法名
startSpeechRecognizer
注意
识别结果在初始化回调中返回
用法
- 用法如下:
js
let params = {
//音频资源,可选值:请参考插件文档
audioSource: "DEFAULT",
//音频采样率,默认值:16000Hz。根据音频采样率在管控台对应项目中配置支持该采样率及场景的模型。
sampleRate: this.form.sampleRate,
//音频输入通道,可选值请参考插件文档
channel: "CHANNEL_IN_MONO",
//编码,可选值请参考插件文档
encoding: "ENCODING_PCM_16BIT",
//帧大小
waveFrameSize: 20 * 2 * 16000 / 1000,
//是否保存录音文件
saveAudio: this.form.saveAudio,
//音频编码格式,支持OPUS编码和PCM原始音频。默认值:OPUS。如果使用8000Hz采样率,则只支持PCM格式。
srFormat: this.form.format,
//是否返回中间识别结果,默认值:false。
enableIntermediateResult: true,
//是否在后处理中添加标点,默认值:false。
enablePunctuationPrediction: true,
//TN(逆文本inverse text normalization)中文数字转换阿拉伯数字。设置为True时,中文数字将转为阿拉伯数字输出,默认值:False。
// enableInverseTextNormalization:true,
//自学习模型ID
// customizationId:"",
//定制泛热词ID
// vocabularyId: "",
//语音断句检测阈值,静音时长超过该阈值被认为断句。取值范围:200ms~2000ms,默认值:800ms。
// maxSentenceSilence: 800,
//是否开启返回词信息。默认值:false。
// enableWords: false,
//过滤语气词,即声音顺滑,默认值false(关闭)。
// disfluency: false,
//设置服务端的vad模型id,默认无需设置。
// vadModel: "",
//噪音参数阈值,取值范围:-1~+1。该参数属高级参数,调整需谨慎并进行重点测试。
// speechNoiseThreshold: 0,
//若需要设置交互协议支持但是接口说明中未说明的参数,可通过此万能设置接口进行配置。具体设置方法请见代码示例。
// extendConfig:{
// "custom_test":true
// },
};
if (this.form.vad) {
//若使用P2T模式,即按下开始说话,放开结束说话的模式,则不启动enableVoiceDetection
params.enableVoiceDetection = true;
params.maxStartSilence = 10000;
params.maxEndSilence = 800
} else {
params.enableVoiceDetection = false;
}
module.startSpeechRecognizer({
params: params,
//成功执行的函数
success: (res) => {
console.log(res)
},
//失败执行的函数
fail: (res) => {
console.log(res)
},
//接口调用完成返回函数,不管成功还是失败都会返回
complete: (res) => {
console.log(res)
}
})js
let params = {
//音频资源,可选值:请参考插件文档
audioSource: "DEFAULT",
//音频采样率,默认值:16000Hz。根据音频采样率在管控台对应项目中配置支持该采样率及场景的模型。
sampleRate: sampleRate.value,
//音频输入通道,可选值请参考插件文档
channel: "CHANNEL_IN_MONO",
//编码,可选值请参考插件文档
encoding: "ENCODING_PCM_16BIT",
//帧大小
waveFrameSize: 20 * 2 * 16000 / 1000,
//是否保存录音文件
saveAudio: saveAudio.value,
//音频编码格式,支持OPUS编码和PCM原始音频。默认值:OPUS。如果使用8000Hz采样率,则只支持PCM格式。
srFormat: format.value,
//是否返回中间识别结果,默认值:false。
enableIntermediateResult: true,
//是否在后处理中添加标点,默认值:false。
enablePunctuationPrediction: true,
//TN(逆文本inverse text normalization)中文数字转换阿拉伯数字。设置为True时,中文数字将转为阿拉伯数字输出,默认值:False。
// enableInverseTextNormalization:true,
//自学习模型ID
// customizationId:"",
//定制泛热词ID
// vocabularyId: "",
//语音断句检测阈值,静音时长超过该阈值被认为断句。取值范围:200ms~2000ms,默认值:800ms。
// maxSentenceSilence: 800,
//是否开启返回词信息。默认值:false。
// enableWords: false,
//过滤语气词,即声音顺滑,默认值false(关闭)。
// disfluency: false,
//设置服务端的vad模型id,默认无需设置。
// vadModel: "",
//噪音参数阈值,取值范围:-1~+1。该参数属高级参数,调整需谨慎并进行重点测试。
// speechNoiseThreshold: 0,
//若需要设置交互协议支持但是接口说明中未说明的参数,可通过此万能设置接口进行配置。具体设置方法请见代码示例。
// extendConfig:{
// "custom_test":true
// },
};
if (vad.value) {
//若使用P2T模式,即按下开始说话,放开结束说话的模式,则不启动enableVoiceDetection
params.enableVoiceDetection = true;
params.maxStartSilence = 10000;
params.maxEndSilence = 800
} else {
params.enableVoiceDetection = false;
}
module.startSpeechRecognizer({
params: params,
//成功执行的函数
success: (res) => {
console.log(res)
},
//失败执行的函数
fail: (res) => {
console.log(res)
},
//接口调用完成返回函数,不管成功还是失败都会返回
// complete: (res) => {
// console.log(res)
// }
} as LevenOptions)- 参数说明
参数名 参数类型 是否必填 默认值 参数描述 params Object 是 无 接口请求参数 params.audioSource String 否 DEFAULT 音频资源,可选值: DEFAULTMICVOICE_UPLINKVOICE_DOWNLINKVOICE_CALLCAMCORDERVOICE_RECOGNITIONVOICE_COMMUNICATIONREMOTE_SUBMIXUNPROCESSEDVOICE_PERFORMANCEparams.sampleRate Integer 否 16000 音频采样率,默认值:16000Hz。根据音频采样率在管控台对应项目中配置支持该采样率及场景的模型 params.channel String 否 CHANNEL_IN_MONO 音频输入通道,可选值: CHANNEL_IN_MONOCHANNEL_IN_BACKCHANNEL_IN_BACK_PROCESSEDCHANNEL_IN_DEFAULTCHANNEL_IN_FRONTCHANNEL_IN_FRONT_PROCESSEDCHANNEL_IN_LEFTCHANNEL_IN_LEFT_PROCESSEDCHANNEL_IN_PRESSURECHANNEL_IN_RIGHTCHANNEL_IN_RIGHT_PROCESSEDCHANNEL_IN_STEREOCHANNEL_IN_VOICE_DNLINKCHANNEL_IN_VOICE_UPLINKCHANNEL_IN_X_AXISCHANNEL_IN_Y_AXISCHANNEL_IN_Z_AXISparams.encoding String 否 ENCODING_PCM_16BIT 编码,可选值: ENCODING_PCM_16BITENCODING_DEFAULTENCODING_PCM_8BITENCODING_PCM_FLOATENCODING_AC3ENCODING_E_AC3ENCODING_DTSENCODING_DTS_HDENCODING_MP3ENCODING_AAC_LCENCODING_AAC_HE_V1ENCODING_AAC_HE_V2ENCODING_IEC61937ENCODING_DOLBY_TRUEHDENCODING_AAC_ELDENCODING_AAC_XHEENCODING_AC4ENCODING_E_AC3_JOCENCODING_DOLBY_MATENCODING_OPUSENCODING_PCM_24BIT_PACKEDENCODING_PCM_32BITENCODING_MPEGH_BL_L3ENCODING_MPEGH_BL_L4ENCODING_MPEGH_LC_L3ENCODING_MPEGH_LC_L4ENCODING_DRAparams.waveFrameSize Integer 否 无 帧大小 params.saveAudio Boolean 否 false 是否保存录音文件 params.srFormat String 否 无 音频编码格式,支持OPUS编码和PCM原始音频。默认值:OPUS。如果使用8000Hz采样率,则只支持PCM格式 params.format String 否 无 音频文件编码格式 params.enableIntermediateResult Boolean 否 false 是否返回中间识别结果 params.enablePunctuationPrediction Boolean 否 false 是否在后处理中添加标点 params.enableInverseTextNormalization Boolean 否 false TN(逆文本inverse text normalization)中文数字转换阿拉伯数字。设置为True时,中文数字将转为阿拉伯数字输出 params.customizationId String 否 无 自学习模型ID params.vocabularyId String 否 无 定制泛热词ID params.maxSentenceSilence Integer 否 800 语音断句检测阈值,静音时长超过该阈值被认为断句。取值范围:200ms~2000ms params.enableWords Boolean 否 false 是否开启返回词信息 params.disfluency Boolean 否 false 过滤语气词,即声音顺滑 params.vadModel String 否 无 设置服务端的vad模型id params.speechNoiseThreshold String 否 无 噪音参数阈值,取值范围:-1~+1 取值越接近-1,判定为语音的概率越大,亦即有可能更多噪声被当作语音被误识别取值越接近+1,判定为噪音的越多,亦即有可能更多语音被当作噪音被拒绝掉。该参数属高级参数,调整需谨慎并进行重点测试params.enableVoiceDetection Boolean 否 false 若要使用VAD模式,则需要设置true params.maxStartSilence Integer 否 无 若要使用VAD模式,则需要设置,具体可参考示例文件 params.maxEndSilence Integer 否 无 若要使用VAD模式,则需要设置,具体可参考示例文件 params.enableWordLevelResult Boolean 否 false 是否返回词级别信息 params.enableTimestampAlignment Boolean 否 false 是否启用时间戳校准功能 params.firstChannelOnly Boolean 否 false 是否只识别首个声道 如果录音识别结果重复,您可以开启此参数params.filterWithEmpty String[] 否 无 替换成空的敏感词,字符串数组集合 params.filterWithSigned String[] 否 无 替换成*的敏感词,字符串数组集合 params.sentenceMaxLength Integer 否 无 每句最多展示字数,取值范围:[4,50]。默认不启用该功能。启用后如不填写字数,则按照长句断句 params.extendConfig Object 否 无 若需要设置交互协议支持但是接口说明中未说明的参数,可通过此万能设置接口进行配置。具体设置方法请见代码示例 success Function 否 无 执行成功的函数 fail Function 否 无 执行失败的函数 complete Function 否 无 执行完成的函数,不管成功还是失败都会执行
回调
- 示例
json
{
"data": {},
"message": "",
"code": 0
}- 回调说明:
参数名 参数类型 参数描述 message String 消息提示 data Object 数据对象 code Integer 返回类型,0.成功,其他:失败
