⌘K

Spark Avatar Picture Omni V2

spark_avatar_picture_omni_v2

Spark Avatar Picture Omni V2 数字人化身生成模型. 通过音频驱动的口型同步技术从图片和音频生成数字人动画视频.

接口提示

图片与音频要求

图片格式: JPG(JPEG), PNG, JFIF 等常见格式, 建议使用 JPG 格式

图片要求: 小于 5 MB, 小于 4096×4096

输入图: 输入图中为单人、人脸占比大、正面效果较好, 其他类型图片效果不佳

音频时长: 建议小于 15 秒以保障生成效果, 音频过长可能有效果裂化问题


认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID

: spark_avatar_picture_omni_v2


image_url string 必需

输入图像 URL


audio_url string 必需

音频 URL, 用于数字人动画


轮询

由于视频生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error object

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息


output array

生成结果. 仅在状态为 completed 时出现

content array

生成内容列表

type string

资源类型

url string

内容 URL

size integer

文件大小

jobId string

远程任务 ID


usage object

使用统计. 仅在状态为 completed 时出现

cost string

总费用(美元)

discount number

折扣金额

input_tokens integer

输入令牌数(固定为 0)

output_tokens integer

输出令牌数(固定为 0)

total_tokens integer

总令牌数(实际为 comfyui_cost)

generated_videos integer

生成的视频数量

generated_images integer

生成的图像数量


metadata object

元数据信息


错误码

错误码描述
003016001缺少图片 URL
003016002缺少音频 URL
003016095内部生成错误
003016096结果解析异常
003016097HTTP 错误响应
003016098状态检查异常
003016099任务创建异常