Redock 可以使用火山引擎豆包语音识别,把录音转成终端输入。它适合中文和中英混合场景。
Redock 调用什么接口
Redock 会把音频发送到:
POST https://openspeech.bytedance.com/api/v3/auc/bigmodel/recognize/flash
请求使用:
- 鉴权字段:
X-Api-Key - 资源字段:
X-Api-Resource-Id - 请求体模型名:
bigmodel - 音频上传方式:Base64 音频数据
Redock 会录制 16 kHz 单声道 WAV 音频后再发送。
开通服务
- 登录火山引擎控制台。
- 进入豆包语音控制台。
- 开通语音识别大模型相关服务。
- 确认录音文件极速版识别 API 可用。
- 确认账号或项目可以使用你准备填写的 Resource ID。
https://console.volcengine.com/speech/app
官方极速版识别 API 文档中的默认 Resource ID 是:
volc.bigasr.auc_turbo
获取 API Key
- 在豆包语音控制台进入 API Key 管理。
- 创建新的 API Key,或复制已有的可用 API Key。
- 妥善保管 key。
Redock 会把 key 存到 Keychain,不会写入应用数据快照。
回填到 Redock
- 打开 My > Speech。
- 将 Speech Provider 设为火山方舟 - 豆包。
- 填写 Resource ID。一般先用
volc.bigasr.auc_turbo,除非控制台显示了其他兼容资源。 - 粘贴 APP Key。
- 回到终端工作区,点击语音按钮测试。
常见问题
- 提示缺少 API Key:检查 My > Speech。
- 无权限或鉴权失败:确认当前账号已开通所填写的 Resource ID。
- 返回空结果:尝试提高音量或延长录音时间。
- 填错字段:
ep-...这类文本推理 Endpoint ID 不是这里需要的 Resource ID。 - 试用或计费问题:在火山控制台检查服务状态、额度和余额。