Spark Dance 1.0 Lite - I2V

接口提示

图生视频-参考图, 根据您输入的参考图片（1-4 张）+ 文本提示词（可选）+ 参数（可选）生成目标视频

图生视频-首尾帧, 根据您输入的首帧图片 + 尾帧图片 + 文本提示词（可选）+ 参数（可选）生成目标视频

图生视频-首帧, 根据您输入的首帧图片 + 文本提示词（可选）+ 参数（可选）生成目标视频

认证

authorization `string` 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key：

访问 API Key 管理页面获取 API Key

用法：

将以下 Header 添加到请求中：

Authorization: Bearer YOUR_API_KEY

参数

model `string` 必需

请求使用的模型 ID

值: spark_dance_v1_0_lite_i2v

content `array` 必需

输入给模型, 生成视频的信息, 支持文本、图片格式. 支持以下组合: 文本+图片

文本内容对象

type string 必需

内容类型

值: text

text string 必需

输入给模型的文本内容, 描述期望生成的视频, 包括:

文本提示词（必填）: 支持中英文. 建议不超过 500 字

图像内容对象

type string 必需

内容类型

值: image_url

image_url object 必需

图片 URL 对象

url string 必需

图片信息, 可以是图片 URL 或图片 Base64 编码

图片 URL: 请确保图片 URL 可被访问

Base64 编码: 请遵循此格式 data:image/<图片格式>;base64,<Base64编码>, 注意 <图片格式> 需小写, 如 data:image/png;base64,{base64_image}

图片要求:
图片格式: jpeg, png, webp, bmp, tiff, gif
宽高比（宽/高）: (0.4, 2.5)
宽高长度（px）: (300, 6000)
大小: 小于 30 MB

role string 条件必填

图片的位置或用途

图生视频-参考图:
字段role取值: 需要传入 1-4 个 image_url 对象, 且字段 role 必填
每张参考图片对应的字段 role 均为: reference_image

图生视频-首帧:
字段role取值: 需要传入 1 个 image_url 对象, 且字段 role 可不填, 或字段 role 为: first_frame

图生视频-首尾帧:
字段role取值: 需要传入 2 个 image_url 对象, 且字段 role 必填
首帧图片对应的字段 role 为: first_frame
尾帧图片对应的字段 role 为: last_frame

callback_url `string`

填写本次生成任务结果的回调通知地址

return_last_frame `boolean`

是否返回生成视频的尾帧图像

true: 返回生成视频的尾帧图像. 设置为 true 后, 可通过查询视频生成任务接口获取视频的尾帧图像. 尾帧图像的格式为 png, 宽高像素值与生成的视频保持一致, 无水印

false: 不返回生成视频的尾帧图像

默认值: false

service_tier `string`

指定处理本次请求的服务等级类型

default: 在线推理模式

flex: 离线推理模式

默认值: default

可选值: default, flex

execution_expires_after `integer`

任务超时阈值. 指定任务提交后的过期时间（单位: 秒）, 从 created_at 时间戳开始计算

默认值: 172800（48 小时）

范围: [3600, 259200]

resolution `string`

视频分辨率

默认值: 720p

可选值: 480p, 720p, 1080p

注意: 参考图场景不支持 1080p

ratio `string`

生成视频的宽高比例

默认值: adaptive（参考图场景默认值为 16:9）

可选值: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

注意: 参考图场景不支持配置 ratio 为 adaptive

duration `integer`

生成视频时长, 单位: 秒

默认值: 5

范围: 2 - 12

frames `integer`

生成视频的帧数

duration 和 frames 二选一即可, frames 的优先级高于 duration. 如果您希望生成小数秒的视频, 建议指定 frames. 通过指定帧数, 可以灵活控制生成视频的长度, 生成小数秒的视频

由于 frames 的取值限制, 仅能支持有限小数秒, 您需要根据公式推算最接近的帧数

计算公式: 帧数 = 时长 × 帧率（24）

取值范围: 支持 [29, 289] 区间内所有满足 25 + 4n 格式的整数值, 其中 n 为正整数

例如: 假设需要生成 2.4 秒的视频, 帧数=2.4×24=57.6. 由于 frames 不支持 57.6, 此时您只能选择一个最接近的值. 根据 25+4n 计算出最接近的帧数为 57, 实际生成的视频为 57/24=2.375 秒

seed `integer`

种子整数, 用于控制生成内容的随机性

默认值: -1

范围: [-1, 2^32-1]

camera_fixed `boolean`

是否固定摄像头

默认值: false

可选值: true, false

注意: 参考图场景不支持此参数

watermark `boolean`

生成视频是否包含水印

默认值: false

可选值: true, false

轮询

由于视频生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error `object`

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息

output `array`

生成结果. 仅在状态为 completed 时出现

content array

生成的视频内容列表

type string

资源类型

值: video

url string

视频 URL（已处理并上传至 CDN）

size integer

视频大小（字节）

jobId string

远程任务 ID

duration integer

视频时长（秒）

format string

视频格式, 默认 mp4

resolution string

视频分辨率

ratio string

视频宽高比

fps integer

视频帧率

usage `object`

使用统计信息. 仅在状态为 completed 时出现

cost string

总费用（美元）

discount number

折扣金额

input_tokens integer

输入令牌数

output_tokens integer

输出令牌数

total_tokens integer

总令牌数

metadata `object`

元数据信息

错误码

错误码	描述
003006095	内部生成错误
003006096	结果解析异常
003006097	HTTP 错误响应
003006098	状态检查异常
003006099	任务创建异常

curl --location 'https://cloud.vtrix.ai/model/v1/generation' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer YOUR_API_KEY' \ --data '{ "model": "spark_dance_v1_0_lite_i2v", "input": [ { "params": { "content": [ { "type": "text", "text": "一个人在公园里散步" }, { "type": "image_url", "image_url": { "url": "https://example.com/reference-image.jpg" }, "role": "reference_image" } ], "resolution": "720p", "ratio": "16:9", "duration": 5 } } ] }'

{ "id": "d5u5obte8783ap44qtj0", "created_at": 1769757744021, "status": "completed", "model": "spark_dance_v1_0_lite_i2v", "output": [ { "content": [ { "type": "video", "url": "https://example.com/generated-video.mp4", "duration": 5, "jobId": "remote_job_id_12345" } ] } ], "usage": { "cost": "0.000500", "discount": 0, "input_tokens": null, "output_tokens": null, "quantity": 1, "time_per_unit": 0, "total_tokens": null, "unit_price": "0.000500", "user_discount": 1 }, "metadata": { "completed_at": 120.5, "in_queue_at": 0, "upload_at": 1.2, "usage": { "input_tokens": 20, "input_tokens_details": { "text_tokens": 20 }, "output_tokens": 0, "total_tokens": 20 } } }

接口提示

认证

authorization string 必需

参数

model string 必需

content array 必需

文本内容对象

type string 必需

text string 必需

图像内容对象

type string 必需

image_url object 必需

url string 必需

role string 条件必填

callback_url string

return_last_frame boolean

service_tier string

execution_expires_after integer

resolution string

ratio string

duration integer

frames integer

seed integer

camera_fixed boolean

watermark boolean

轮询

响应格式

error object

code string

error_message string

output array

content array

type string

url string

size integer

jobId string

duration integer

format string

resolution string

ratio string

fps integer

usage object

cost string

discount number

input_tokens integer

output_tokens integer

total_tokens integer

metadata object

错误码

authorization `string` 必需

model `string` 必需

content `array` 必需

type `string` 必需

text `string` 必需

type `string` 必需

image_url `object` 必需

url `string` 必需

role `string` 条件必填

callback_url `string`

return_last_frame `boolean`

service_tier `string`

execution_expires_after `integer`

resolution `string`

ratio `string`

duration `integer`

frames `integer`

seed `integer`

camera_fixed `boolean`

watermark `boolean`

error `object`

code `string`

error_message `string`

output `array`

content `array`

type `string`

url `string`

size `integer`

jobId `string`

duration `integer`

format `string`

resolution `string`

ratio `string`

fps `integer`

usage `object`

cost `string`

discount `number`

input_tokens `integer`

output_tokens `integer`

total_tokens `integer`

metadata `object`