返回指南列表
语音输入

火山豆包语音配置

配置火山引擎豆包语音识别,用于中文和中英混合口述。

Redock 可以使用火山引擎豆包语音识别,把录音转成终端输入。它适合中文和中英混合场景。

Redock 调用什么接口

Redock 会把音频发送到:

POST https://openspeech.bytedance.com/api/v3/auc/bigmodel/recognize/flash

请求使用:

  • 鉴权字段:X-Api-Key
  • 资源字段:X-Api-Resource-Id
  • 请求体模型名:bigmodel
  • 音频上传方式:Base64 音频数据

Redock 会录制 16 kHz 单声道 WAV 音频后再发送。

开通服务

  1. 登录火山引擎控制台。
  2. 进入豆包语音控制台。
  3. 开通语音识别大模型相关服务。
  4. 确认录音文件极速版识别 API 可用。
  5. 确认账号或项目可以使用你准备填写的 Resource ID。
https://console.volcengine.com/speech/app

官方极速版识别 API 文档中的默认 Resource ID 是:

volc.bigasr.auc_turbo

获取 API Key

  1. 在豆包语音控制台进入 API Key 管理。
  2. 创建新的 API Key,或复制已有的可用 API Key。
  3. 妥善保管 key。

Redock 会把 key 存到 Keychain,不会写入应用数据快照。

回填到 Redock

  1. 打开 My > Speech。
  2. 将 Speech Provider 设为火山方舟 - 豆包。
  3. 填写 Resource ID。一般先用 volc.bigasr.auc_turbo,除非控制台显示了其他兼容资源。
  4. 粘贴 APP Key。
  5. 回到终端工作区,点击语音按钮测试。

常见问题

  • 提示缺少 API Key:检查 My > Speech。
  • 无权限或鉴权失败:确认当前账号已开通所填写的 Resource ID。
  • 返回空结果:尝试提高音量或延长录音时间。
  • 填错字段:ep-... 这类文本推理 Endpoint ID 不是这里需要的 Resource ID。
  • 试用或计费问题:在火山控制台检查服务状态、额度和余额。

官方参考

跟着指南在 Redock 里试一下

用手机控制 Coding Agent,随时进行开发

免费获取 Redock