接口提示
图片与音频要求
图片格式: JPG(JPEG), PNG, JFIF 等常见格式, 建议使用 JPG 格式
图片要求: 小于 5 MB, 小于 4096×4096
输入图: 输入图中为单人、人脸占比大、正面效果较好, 其他类型图片效果不佳
音频时长: 建议小于 15 秒以保障生成效果, 音频过长可能有效果裂化问题
认证
authorization string 必需
所有 API 均使用 Bearer Token 鉴权
获取 API Key:
访问 API Key 管理页面 获取 API Key
用法:
将以下 Header 添加到请求中:
Authorization: Bearer YOUR_API_KEY
参数
model string 必需
请求使用的模型 ID
值: spark_avatar_picture_omni_v2
image_url string 必需
输入图像 URL
audio_url string 必需
音频 URL, 用于数字人动画
轮询
由于视频生成需要时间, 您需要在创建任务后轮询任务状态
初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取
响应格式
error object
错误信息. 仅在状态为 failed 时出现
code
string错误码
error_message
string详细错误信息
output array
生成结果. 仅在状态为 completed 时出现
content
array生成内容列表
type
string资源类型
url
string内容 URL
size
integer文件大小
jobId
string远程任务 ID
usage object
使用统计. 仅在状态为 completed 时出现
cost
string总费用(美元)
discount
number折扣金额
input_tokens
integer输入令牌数(固定为 0)
output_tokens
integer输出令牌数(固定为 0)
total_tokens
integer总令牌数(实际为 comfyui_cost)
generated_videos
integer生成的视频数量
generated_images
integer生成的图像数量
metadata object
元数据信息
错误码
| 错误码 | 描述 |
|---|---|
| 003016001 | 缺少图片 URL |
| 003016002 | 缺少音频 URL |
| 003016095 | 内部生成错误 |
| 003016096 | 结果解析异常 |
| 003016097 | HTTP 错误响应 |
| 003016098 | 状态检查异常 |
| 003016099 | 任务创建异常 |