数字先锋API文档
快速上手
快速上手及令牌分组说明
如何获取接口地址与令牌
Models(列出可用模型)
体验中心 API 如何设置
多模型同屏对比体验(同步输出)
工作台
操练场
聊天(对话)
数据看板
令牌管理
使用日志
绘图日志
异步任务
钱包管理
订单中心
我的工单
个人设置
对话(chat)
所有对话模型均兼容 OpenAI 格式
OpenAI 图像生成(绘画)
Claude Messages(对话)
Claude Messages(识图)
Claude Messages(思考)
Claude Messages(函数调用)
Claude Chat(OpenAI 兼容)
Gemini 官方格式
Gemini 对话(OpenAI 兼容)
Gemini 绘画(OpenAI 兼容)
Chat(流式返回)
Chat(分析图片)
Chat(工具tools调用)
Chat(思考Thinking)
Flux 绘画(OpenAI 兼容)
X.AI 绘画(OpenAI 兼容)
X.AI 对话(OpenAI 兼容)
智谱 对话(OpenAI 兼容)
千问Qwen 对话(OpenAI 兼容)
绘画模型
Gemini 绘画(nano-banana系列)
Gemini 绘画(官方原生系列)
Midjourney 绘画模型格式
火山豆包(Doubao)绘画模型格式
千问(Qwen)绘画
千问(Qwen)图像编辑
视频模型
Gemini 视频模型格式
豆包视频(Doubao)模型格式
sora 视频生成格式
对话(Responses)
Responses API与Chat API对比
Responses(统一响应)
Responses(联网搜索)
音频(Audio)
文本转语音(TTS)原生OpenAI格式
MiniMax 语音合成(TTS)
行业应用
OCR 识别 API 文档
Embeddings(向量嵌入)
常见问题
兑换码充值使用指南
平台合规与服务声明
工具软件
CentOS + 宝塔 部署 OpenClaw(源码开发版)完整教程
Ubuntu + 宝塔 部署 OpenClaw(源码开发版)完整教程
OpenClaw 对接数字先锋 API模型实战教程
首页
# 语音合成 API 文档(TTS) MiniMax 模型speech开头如:speech-01-turbo、speech-01-hd、speech-02-hd、speech-2.6-hd、speech-2.6-turbo 体验网址:https://try.cxsee.com/voice/minimax/ ## 1. 接口地址 ```bash POST https://api.cxsee.com/v1/audio/speech ``` ## 2. 认证方式 在请求头中传入 Bearer Token: ```http Authorization: Bearer sk-xxxxxxxx ``` ## 3. 请求头 ```http Content-Type: application/json Authorization: Bearer sk-xxxxxxxx ``` ## 4. 请求参数(JSON) | 参数 | 类型 | 必填 | 说明 | 示例 | |---|---|---|---|---| | model | string | 是 | TTS 模型名称 | `speech-01-turbo` | | input | string | 是 | 要合成的文本内容 | `你好,这是一个测试。` | | voice | string | 是 | 发音人音色 | `alloy` | | speed | number | 否 | 语速,默认 1 | `1` | | output_format | string | 否 | 输出格式(当前默认返回音频流) | `mp3` / `url`* | > 说明:当前服务实测返回为 `audio/mpeg` 音频流。即使传入 `output_format: "url"`,仍可能返回音频流(以实际网关配置为准)。 --- ## 5. cURL 示例 ### 示例 A:直接返回音频流并保存为 mp3(推荐) ```bash curl -sS "https://api.cxsee.com/v1/audio/speech" \ -H "Authorization: Bearer sk-你的密钥" \ -H "Content-Type: application/json" \ -d '{ "model":"speech-01-turbo", "input":"你好,这是音频落盘测试。", "voice":"alloy", "speed":1 }' \ -o test.mp3 ``` 验证文件: ```bash file test.mp3 ``` --- ### 示例 B:查看响应头(排查用) ```bash curl -i -sS "https://api.cxsee.com/v1/audio/speech" \ -H "Authorization: Bearer sk-你的密钥" \ -H "Content-Type: application/json" \ -d '{ "model":"speech-01-turbo", "input":"你好,这是直连接口测试。", "voice":"alloy", "output_format":"url", "speed":1 }' ``` --- ## 6. 成功响应 ### HTTP 状态码 - `200 OK` ### Content-Type - `audio/mpeg` ### 响应体 - 二进制 MP3 音频流(可直接保存为 `.mp3` 文件) --- ## 7. 常见错误 | HTTP 状态码 | 含义 | 可能原因 | |---|---|---| | 400 | 请求参数错误 | `model/input/voice` 缺失或格式错误 | | 401 | 认证失败 | API Key 无效、缺失或格式错误 | | 403 | 无权限 | Key 无对应模型权限 | | 429 | 请求过频 | 超过限流阈值 | | 500 | 服务内部错误 | 上游异常或网关处理失败 | | 502/504 | 网关或上游超时 | 网络抖动或上游服务不可用 | ---
上一篇:文本转语音(TTS)原生OpenAI格式
下一篇:Chat(流式返回)