⌘K

Spark Dance 1.0 Lite - I2V

spark_dance_v1_0_lite_i2v

图生视频生成, 在保留主体身份的同时添加连贯自然的动作

接口提示

图生视频-参考图, 根据您输入的参考图片(1-4 张)+ 文本提示词(可选)+ 参数(可选)生成目标视频

图生视频-首尾帧, 根据您输入的首帧图片 + 尾帧图片 + 文本提示词(可选)+ 参数(可选)生成目标视频

图生视频-首帧, 根据您输入的首帧图片 + 文本提示词(可选)+ 参数(可选)生成目标视频


认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID

: spark_dance_v1_0_lite_i2v


content array 必需

输入给模型, 生成视频的信息, 支持文本、图片格式. 支持以下组合: 文本+图片

文本内容对象

type string 必需

内容类型

: text

text string 必需

输入给模型的文本内容, 描述期望生成的视频, 包括:

文本提示词(必填): 支持中英文. 建议不超过 500 字

图像内容对象

type string 必需

内容类型

: image_url

image_url object 必需

图片 URL 对象

url string 必需

图片信息, 可以是图片 URL 或图片 Base64 编码

图片 URL: 请确保图片 URL 可被访问

Base64 编码: 请遵循此格式 data:image/<图片格式>;base64,<Base64编码>, 注意 <图片格式> 需小写, 如 data:image/png;base64,{base64_image}

图片要求:
图片格式: jpeg, png, webp, bmp, tiff, gif
宽高比(宽/高): (0.4, 2.5)
宽高长度(px): (300, 6000)
大小: 小于 30 MB

role string 条件必填

图片的位置或用途

图生视频-参考图:
字段role取值: 需要传入 1-4 个 image_url 对象, 且字段 role 必填
每张参考图片对应的字段 role 均为: reference_image

图生视频-首帧:
字段role取值: 需要传入 1 个 image_url 对象, 且字段 role 可不填, 或字段 role 为: first_frame

图生视频-首尾帧:
字段role取值: 需要传入 2 个 image_url 对象, 且字段 role 必填
首帧图片对应的字段 role 为: first_frame
尾帧图片对应的字段 role 为: last_frame


callback_url string

填写本次生成任务结果的回调通知地址


return_last_frame boolean

是否返回生成视频的尾帧图像

true: 返回生成视频的尾帧图像. 设置为 true 后, 可通过查询视频生成任务接口获取视频的尾帧图像. 尾帧图像的格式为 png, 宽高像素值与生成的视频保持一致, 无水印

false: 不返回生成视频的尾帧图像

默认值: false


service_tier string

指定处理本次请求的服务等级类型

default: 在线推理模式

flex: 离线推理模式

默认值: default

可选值: default, flex


execution_expires_after integer

任务超时阈值. 指定任务提交后的过期时间(单位: 秒), 从 created_at 时间戳开始计算

默认值: 172800(48 小时)

范围: [3600, 259200]


resolution string

视频分辨率

默认值: 720p

可选值: 480p, 720p, 1080p

注意: 参考图场景不支持 1080p


ratio string

生成视频的宽高比例

默认值: adaptive(参考图场景默认值为 16:9

可选值: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

注意: 参考图场景不支持配置 ratioadaptive


duration integer

生成视频时长, 单位: 秒

默认值: 5

范围: 2 - 12


frames integer

生成视频的帧数

durationframes 二选一即可, frames 的优先级高于 duration. 如果您希望生成小数秒的视频, 建议指定 frames. 通过指定帧数, 可以灵活控制生成视频的长度, 生成小数秒的视频

由于 frames 的取值限制, 仅能支持有限小数秒, 您需要根据公式推算最接近的帧数

计算公式: 帧数 = 时长 × 帧率(24

取值范围: 支持 [29, 289] 区间内所有满足 25 + 4n 格式的整数值, 其中 n 为正整数

例如: 假设需要生成 2.4 秒的视频, 帧数=2.4×24=57.6. 由于 frames 不支持 57.6, 此时您只能选择一个最接近的值. 根据 25+4n 计算出最接近的帧数为 57, 实际生成的视频为 57/24=2.375


seed integer

种子整数, 用于控制生成内容的随机性

默认值: -1

范围: [-1, 2^32-1]


camera_fixed boolean

是否固定摄像头

默认值: false

可选值: true, false

注意: 参考图场景不支持此参数


watermark boolean

生成视频是否包含水印

默认值: false

可选值: true, false



轮询

由于视频生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error object

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息


output array

生成结果. 仅在状态为 completed 时出现

content array

生成的视频内容列表

type string

资源类型

: video

url string

视频 URL(已处理并上传至 CDN)

size integer

视频大小(字节)

jobId string

远程任务 ID

duration integer

视频时长(秒)

format string

视频格式, 默认 mp4

resolution string

视频分辨率

ratio string

视频宽高比

fps integer

视频帧率


usage object

使用统计信息. 仅在状态为 completed 时出现

cost string

总费用(美元)

discount number

折扣金额

input_tokens integer

输入令牌数

output_tokens integer

输出令牌数

total_tokens integer

总令牌数


metadata object

元数据信息


错误码

错误码描述
003006095内部生成错误
003006096结果解析异常
003006097HTTP 错误响应
003006098状态检查异常
003006099任务创建异常