数字先锋API文档
快速上手
快速上手及令牌分组说明
如何获取接口地址与令牌
Models(列出可用模型)
体验中心 API 如何设置
多模型同屏对比体验(同步输出)
工作台
操练场
聊天(对话)
数据看板
令牌管理
使用日志
绘图日志
异步任务
钱包管理
订单中心
我的工单
个人设置
对话(chat)
所有对话模型均兼容 OpenAI 格式
OpenAI 图像生成(绘画)
Claude Messages(对话)
Claude Messages(识图)
Claude Messages(思考)
Claude Messages(函数调用)
Claude Chat(OpenAI 兼容)
Gemini 官方格式
Gemini 对话(OpenAI 兼容)
Gemini 绘画(OpenAI 兼容)
Chat(流式返回)
Chat(分析图片)
Chat(工具tools调用)
Chat(思考Thinking)
Flux 绘画(OpenAI 兼容)
X.AI 绘画(OpenAI 兼容)
X.AI 对话(OpenAI 兼容)
智谱 对话(OpenAI 兼容)
千问Qwen 对话(OpenAI 兼容)
Xiaomi MiMo 对话(OpenAI 兼容)
Xiaomi MiMo 对话 Messages
Xiaomi MiMo 函数调用 Messages
绘画模型
Gemini 绘画(nano-banana系列)
Gemini 绘画(官方原生系列)
Midjourney 绘画模型格式
火山豆包(Doubao)绘画模型格式
可灵(Kling)绘画
千问(Qwen)绘画
千问(Qwen)图像编辑
视频模型
Gemini 视频模型格式
豆包视频(Doubao)模型格式
sora 视频生成格式
Luma 视频生成格式
对话(Responses)
Responses API与Chat API对比
Responses(统一响应)
Responses(联网搜索)
音频(Audio)
语音转文本(TTS)原生OpenAI格式
Xiaomi MiMo语音合成(TTS)
文本转语音(TTS)原生OpenAI格式
MiniMax 语音合成(TTS)
音乐(Suno)
Suno 生成歌词(lyrics)
Suno 生成歌曲(music)
OpenClaw接入
查看网关令牌及设备授权
配置文件增加数字先锋API模型
CentOS + 宝塔 部署 OpenClaw(源码版)完整教程
Ubuntu + 宝塔 部署 OpenClaw(源码开发版)完整教程
OpenClaw 对接数字先锋 API模型实战教程
文章封面
文章封面生成示例
封面生成与文字叠加功能
行业应用
OCR 识别 API 文档
Embeddings(向量嵌入)
常见问题
兑换码充值使用指南
平台合规与服务声明
首页
# 语音转文本(TTS)原生OpenAI格式 API 文档 体验网址:https://try.cxsee.com/voice/openai/ 可用模型whisper-1 ## 1. 接口说明 将音频文件转写为文本内容,兼容 OpenAI Whisper 风格调用方式。 - **接口地址**:`POST /v1/audio/transcriptions` - **Content-Type**:`multipart/form-data` - **认证方式**:`Authorization: Bearer
` --- ## 2. 请求参数 采用 `multipart/form-data` 传参: | 参数名 | 类型 | 必填 | 说明 | |---|---|---:|---| | `file` | File | 是 | 待转写的音频文件(如 `.mp3`) | | `model` | String | 是 | 模型名称,固定填写:`whisper-1` | | `response_format` | String | 否 | 返回格式,建议 `json`(默认 `json`) | --- ## 3. 请求示例(cURL) ```bash curl -sS -X POST "https://api.cxsee.com/v1/audio/transcriptions" \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "file=@/path/to/demo.mp3" \ -F "model=whisper-1" \ -F "response_format=json" ``` --- ## 4. 成功响应示例 ```json { "text": "数字先锋API 是一站式大模型语言服务平台, 聚合了 OpenAI、Cloud、Gemini、DeepSeek、Grok、Quen 等主流模型能力。", "usage": { "type": "duration", "seconds": 13 } } ``` ### 字段说明 | 字段 | 类型 | 说明 | |---|---|---| | `text` | String | 转写后的文本内容 | | `usage.type` | String | 计量类型,当前为 `duration` | | `usage.seconds` | Number | 音频时长(秒) | --- ## 5. 错误响应示例 ```json { "error": { "message": "Invalid request", "type": "invalid_request_error" } } ``` 常见错误原因: - 未携带或携带了无效 `Authorization`; - `file` 未上传或文件为空; - `model` 非 `whisper-1`; - 请求头或表单格式错误(应为 `multipart/form-data`)。 --- ## 6. 调用建议 1. **音频格式**:建议使用清晰语音的 `mp3/wav` 文件。 2. **文件大小**:控制在平台允许范围内(如有网关限制请以实际配置为准)。 3. **超时设置**:客户端建议设置 60 秒以上超时。 4. **重试策略**:网络波动时可做幂等重试(建议指数退避)。 --- ## 7. 兼容性说明 本接口遵循 OpenAI 风格的语音转写调用方式,适配多数已接入 OpenAI Audio Transcriptions 的客户端。 ---
上一篇:Luma 视频生成格式
下一篇:Suno 生成歌词(lyrics)