public class TAipSpeech extends BaseClient
app_id, app_key, config| 构造器和说明 |
|---|
TAipSpeech(String app_id,
String app_key) |
| 限定符和类型 | 方法和说明 |
|---|---|
String |
aaiDetectkeywordBySpeech(byte[] speech,
int format,
String callback_url,
String key_words,
Integer rate)
关键词检索
上传长音频,提供回调接口,异步获取识别结果
|
String |
aaiDetectkeywordBySpeech(String speechfilePath,
int format,
String callback_url,
String key_words,
Integer rate)
关键词检索
上传长音频,提供回调接口,异步获取识别结果
|
String |
aaiDetectkeywordBySpeechURL(String speech_url,
int format,
String callback_url,
String key_words)
关键词检索
上传长音频,提供回调接口,异步获取识别结果
|
String |
aaiDetectkeywordBySpeechURL(String speech_url,
int format,
String callback_url,
String key_words,
Integer rate)
关键词检索
上传长音频,提供回调接口,异步获取识别结果
|
String |
asrEcho(byte[] audio,
int format)
语音识别-echo版
对音频进行语音识别,并返回语音的文字内容
|
String |
asrEcho(byte[] audio,
int format,
int rate)
语音识别-echo版
对音频进行语音识别,并返回语音的文字内容
|
String |
asrEcho(String filePath,
int format)
语音识别-echo版
对音频进行语音识别,并返回语音的文字内容
|
String |
asrEcho(String filePath,
int format,
int rate)
语音识别-echo版
对音频进行语音识别,并返回语音的文字内容
|
String |
asrLab(int format,
int rate,
int seq,
int len,
int end,
byte[] audio)
语音识别-流式版(AI Lab)
对音频进行语音识别,并返回语音的文字内容
|
String |
asrLab(int format,
int rate,
int seq,
int len,
int end,
String speech_chunk)
语音识别-流式版(AI Lab)
对音频进行语音识别,并返回语音的文字内容
|
String |
asrLab(String filePath,
int format,
int rate,
int seq,
int len,
int end)
语音识别-流式版(AI Lab)
对音频进行语音识别,并返回语音的文字内容
|
String |
asrLong(byte[] speech,
int format,
String callback_url)
长语音识别 待识别语音
上传长音频,提供回调接口,异步获取识别结果
|
String |
asrLong(String speechPath,
int format,
String callback_url)
长语音识别 待识别语音
上传长音频,提供回调接口,异步获取识别结果
|
String |
asrLongByUrl(String speech_url,
int format,
String callback_url)
长语音识别 待识别语音下载地址
上传长音频,提供回调接口,异步获取识别结果
|
String |
asrWx(byte[] audio,
int format,
int rate,
int bits,
int seq,
int len,
int end,
int cont_res)
语音识别-流式版(WeChat AI)
对音频进行语音识别,并返回语音的文字内容
|
String |
asrWx(String filePath,
int format,
int rate,
int bits,
int seq,
int len,
int end,
int cont_res)
语音识别-流式版(WeChat AI)
对音频进行语音识别,并返回语音的文字内容
|
String |
TtaSynthesis(String text)
语音合成(优图)
将文字转换为语音,返回文字的语音数据。
|
String |
TtaSynthesis(String text,
int model_type,
int speed)
语音合成(优图)
将文字转换为语音,返回文字的语音数据。
|
String |
TtsSynthesis(String text,
int speaker,
int format)
语音合成(AI Lab) 默认值
将文字转换为语音,返回文字的语音数据。
|
String |
TtsSynthesis(String text,
int speaker,
int format,
int volume,
int speed,
int aht,
int apc)
语音合成(AI Lab) 非默认值
将文字转换为语音,返回文字的语音数据。
|
requestServer, setConnectionTimeoutInMillis, setHttpProxy, setSocketProxy, setSocketTimeoutInMillispublic String asrEcho(byte[] audio, int format, int rate) throws Exception
audio - - 二进制音频数据format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - - 语音采样率编码 8000 16000Exceptionpublic String asrEcho(String filePath, int format, int rate) throws Exception
filePath - - 音频文件本地路径format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - - 语音采样率编码 8000 16000Exceptionpublic String asrEcho(byte[] audio, int format) throws Exception
audio - - 二进制音频数据format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4Exceptionpublic String asrEcho(String filePath, int format) throws Exception
filePath - - 音频文件本地路径format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4Exceptionpublic String asrLab(int format, int rate, int seq, int len, int end, String speech_chunk) throws Exception
format - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - 音频采样率编码 8000 16000seq - 语音分片所在语音流的偏移量(字节)len - 语音分片长度(字节)end - 是否结束分片标识 0中间分片 1结束分片speech_chunk - 待识别语音分片 base64编码数据Exceptionpublic String asrLab(int format, int rate, int seq, int len, int end, byte[] audio) throws Exception
format - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - 音频采样率编码 8000 16000seq - 语音分片所在语音流的偏移量(字节)len - 语音分片长度(字节)end - 是否结束分片标识 0中间分片 1结束分片audio - 音频二进制数据Exceptionpublic String asrLab(String filePath, int format, int rate, int seq, int len, int end) throws Exception
filePath - 音频文件本地路径format - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - 音频采样率编码 8000 16000seq - 语音分片所在语音流的偏移量(字节)len - 语音分片长度(字节)end - 是否结束分片标识 0中间分片 1结束分片Exceptionpublic String asrWx(byte[] audio, int format, int rate, int bits, int seq, int len, int end, int cont_res) throws Exception
audio - - 二进制音频数据format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4 SPEEX-5 MP3-8rate - - 语音采样率编码 8000 16000bits - 音频采样位数 16seq - 语音分片所在语音流的偏移量(字节)len - 语音分片长度(字节)end - 是否结束分片标识 0中间分片 1结束分片cont_res - 是否获取中间识别结果 0不获取 1获取Exceptionpublic String asrWx(String filePath, int format, int rate, int bits, int seq, int len, int end, int cont_res) throws Exception
filePath - - 音频文件本地路径format - - 语音压缩格式编码 PCM-1 WAV-2 AMR-3 SILK-4rate - - 语音采样率编码 8000 16000bits - 音频采样位数 16seq - 语音分片所在语音流的偏移量(字节)len - 语音分片长度(字节)end - 是否结束分片标识 0中间分片 1结束分片cont_res - 是否获取中间识别结果 0不获取 1获取Exceptionpublic String TtsSynthesis(String text, int speaker, int format, int volume, int speed, int aht, int apc) throws Exception
text - 待合成文本speaker - 语音发音人编码format - 合成语音格式编码volume - 合成语音音量 取值范围[-10, 10],如-10表示音量相对默认值小10dB,0表示默认音量,10表示音量相对默认值大10dBspeed - 合成语音语速,默认100aht - 合成语音降低/升高半音个数,即改变音高,默认0apc - 控制频谱翘曲的程度,改变说话人的音色,默认58Exceptionpublic String TtsSynthesis(String text, int speaker, int format) throws Exception
text - 待合成文本speaker - 语音发音人编码format - 合成语音格式编码Exceptionpublic String TtaSynthesis(String text, int model_type, int speed) throws Exception
text - 待合成语音文本model_type - 发音模型speed - 语速Exceptionpublic String TtaSynthesis(String text) throws Exception
text - 待合成语音文本Exceptionpublic String asrLong(byte[] speech, int format, String callback_url) throws Exception
speech - 语音数据的Base64编码,原始音频大小上限5MBformat - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果Exceptionpublic String asrLongByUrl(String speech_url, int format, String callback_url) throws Exception
speech_url - 待识别语音下载地址format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果Exceptionpublic String asrLong(String speechPath, int format, String callback_url) throws Exception
speechPath - 音频文件本地路径format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果Exceptionpublic String aaiDetectkeywordBySpeechURL(String speech_url, int format, String callback_url, String key_words) throws Exception
speech_url - 语音的二进制数据format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果key_words - 待识别关键词 多个关键词之间用“|”分隔,每个词长度不低于两个字,上限500个词Exceptionpublic String aaiDetectkeywordBySpeech(byte[] speech, int format, String callback_url, String key_words, Integer rate) throws Exception
speech - 语音的二进制数据format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果key_words - 待识别关键词 多个关键词之间用“|”分隔,每个词长度不低于两个字,上限500个词rate - 采样频率 默认只支持8000Exceptionpublic String aaiDetectkeywordBySpeech(String speechfilePath, int format, String callback_url, String key_words, Integer rate) throws Exception
speechfilePath - 本地路径语音文件format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果key_words - 待识别关键词 多个关键词之间用“|”分隔,每个词长度不低于两个字,上限500个词Exceptionpublic String aaiDetectkeywordBySpeechURL(String speech_url, int format, String callback_url, String key_words, Integer rate) throws Exception
speech_url - 语音文件的网络路径format - 语音压缩格式编码callback_url - 用户回调url,需用户提供,用于平台向用户通知识别结果key_words - 待识别关键词 多个关键词之间用“|”分隔,每个词长度不低于两个字,上限500个词rate - 采样频率 默认只支持8000ExceptionCopyright © 2018. All rights reserved.