返回指南列表

语音输入

火山豆包语音配置

配置火山引擎豆包语音识别，用于中文和中英混合口述。

Redock 可以使用火山引擎豆包语音识别，把录音转成终端输入。它适合中文和中英混合场景。

Redock 调用什么接口

Redock 会把音频发送到：

POST https://openspeech.bytedance.com/api/v3/auc/bigmodel/recognize/flash

请求使用：

鉴权字段：X-Api-Key
资源字段：X-Api-Resource-Id
请求体模型名：bigmodel
音频上传方式：Base64 音频数据

Redock 会录制 16 kHz 单声道 WAV 音频后再发送。

开通服务

登录火山引擎控制台。
进入豆包语音控制台。
开通语音识别大模型相关服务。
确认录音文件极速版识别 API 可用。
确认账号或项目可以使用你准备填写的 Resource ID。

https://console.volcengine.com/speech/app

官方极速版识别 API 文档中的默认 Resource ID 是：

volc.bigasr.auc_turbo

获取 API Key

在豆包语音控制台进入 API Key 管理。
创建新的 API Key，或复制已有的可用 API Key。
妥善保管 key。

Redock 会把 key 存到 Keychain，不会写入应用数据快照。

回填到 Redock

打开 My > Speech。
将 Speech Provider 设为火山方舟 - 豆包。
填写 Resource ID。一般先用 volc.bigasr.auc_turbo，除非控制台显示了其他兼容资源。
粘贴 APP Key。
回到终端工作区，点击语音按钮测试。

常见问题

提示缺少 API Key：检查 My > Speech。
无权限或鉴权失败：确认当前账号已开通所填写的 Resource ID。
返回空结果：尝试提高音量或延长录音时间。
填错字段：ep-... 这类文本推理 Endpoint ID 不是这里需要的 Resource ID。
试用或计费问题：在火山控制台检查服务状态、额度和余额。

官方参考

跟着指南在 Redock 里试一下

用手机控制 Coding Agent，随时进行开发

免费获取 Redock