MiniMax 语音合成（TTS） - 数字先锋API文档

# 语音合成 API 文档（TTS）

MiniMax 模型speech开头如：speech-01-turbo、speech-01-hd、speech-02-hd、speech-2.6-hd、speech-2.6-turbo

体验网址：https://try.cxsee.com/voice/minimax/
## 1. 接口地址

```bash
POST https://api.cxsee.com/v1/audio/speech
```

## 2. 认证方式

在请求头中传入 Bearer Token：

```http
Authorization: Bearer sk-xxxxxxxx
```

## 3. 请求头

```http
Content-Type: application/json
Authorization: Bearer sk-xxxxxxxx
```

## 4. 请求参数（JSON）

| 参数 | 类型 | 必填 | 说明 | 示例 |
|---|---|---|---|---|
| model | string | 是 | TTS 模型名称 | `speech-01-turbo` |
| input | string | 是 | 要合成的文本内容 | `你好，这是一个测试。` |
| voice | string | 是 | 发音人音色 | `alloy` |
| speed | number | 否 | 语速，默认 1 | `1` |
| output_format | string | 否 | 输出格式（当前默认返回音频流） | `mp3` / `url`* |

> 说明：当前服务实测返回为 `audio/mpeg` 音频流。即使传入 `output_format: "url"`，仍可能返回音频流（以实际网关配置为准）。

---

## 5. cURL 示例

### 示例 A：直接返回音频流并保存为 mp3（推荐）

```bash
curl -sS "https://api.cxsee.com/v1/audio/speech" \
  -H "Authorization: Bearer sk-你的密钥" \
  -H "Content-Type: application/json" \
  -d '{
    "model":"speech-01-turbo",
    "input":"你好，这是音频落盘测试。",
    "voice":"alloy",
    "speed":1
  }' \
  -o test.mp3
```

验证文件：

```bash
file test.mp3
```

---

### 示例 B：查看响应头（排查用）

```bash
curl -i -sS "https://api.cxsee.com/v1/audio/speech" \
  -H "Authorization: Bearer sk-你的密钥" \
  -H "Content-Type: application/json" \
  -d '{
    "model":"speech-01-turbo",
    "input":"你好，这是直连接口测试。",
    "voice":"alloy",
    "output_format":"url",
    "speed":1
  }'
```

---

## 6. 成功响应

### HTTP 状态码
- `200 OK`

### Content-Type
- `audio/mpeg`

### 响应体
- 二进制 MP3 音频流（可直接保存为 `.mp3` 文件）

---

## 7. 常见错误

| HTTP 状态码 | 含义 | 可能原因 |
|---|---|---|
| 400 | 请求参数错误 | `model/input/voice` 缺失或格式错误 |
| 401 | 认证失败 | API Key 无效、缺失或格式错误 |
| 403 | 无权限 | Key 无对应模型权限 |
| 429 | 请求过频 | 超过限流阈值 |
| 500 | 服务内部错误 | 上游异常或网关处理失败 |
| 502/504 | 网关或上游超时 | 网络抖动或上游服务不可用 |

---

上一篇：文本转语音（TTS）原生OpenAI格式下一篇：Chat（流式返回）