Spark DreamO - Multi IP | Vtrix API Docs

接口提示

输入的图片需要满足以下要求：

图片格式： 仅支持 JPEG、PNG 格式, 建议使用 JPEG 格式

图片文件大小： 最大 4.7 MB, 图片分辨率：最大 4096 * 4096

图片比例： 推荐范围为 16:9 到 9:16（极端比例效果欠佳, 有概率报错）

认证

authorization `string` 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key：

访问 API Key 管理页面获取 API Key

用法：

将以下 Header 添加到请求中：

Authorization: Bearer YOUR_API_KEY

参数

model `string` 必需

请求使用的模型 ID

值: spark_multi_dreamo

binary_data_base64 `array` 必需（二选一）

图片文件, Base64 编码. 最多支持输入 5 张图片

image_urls 和 binary_data_base64 二选一, 必须提供其中一个

image_urls `array` 必需（二选一）

图片文件 URL（必须公网可正常访问）. 最多支持输入 5 张图片

image_urls 和 binary_data_base64 二选一, 必须提供其中一个

prompt `string` 必需

用于编辑图像的提示词, 支持中英双语, 长度建议控制在 300 字符左右, 过长会不生效且易引起异常

ref_type_list `array`

指定每张参考图的参考类型, 此数组长度必须等于参考图数量

参考类型默认值为 AUTO, 模型会自动匹配参考类型, 但会增加推理耗时. 建议在参考类型固定的场景中, 手动指定每张参考图的参考类型

IP: 参考主体特征
ID: 参考人脸特征
STYLE: 参考风格特征
AUTO: 自动匹配参考类型（默认值）

可选值: IP, ID, STYLE, AUTO

默认值: AUTO

guidance_scale1 `number`

控制生成结果对文本描述的一致性. 该参数越大, 文本一致性越高, 但图像一致性越低

范围: 1.0 到 7.0

默认值: 2.5

guidance_scale2 `number`

控制生成结果对图像的一致性. 该参数越大, 图像一致性越高, 但文本一致性越低

范围: 1.0 到 7.0

默认值: 2.5

ddim_steps `integer`

生成图像的步数

范围: 1 到 50

默认值: 12

swap_face `boolean`

是否使用脸部 ID 增强. 开启后人脸一致性更高, 但会影响表情、妆容等面部属性编辑, 并且会增加耗时

可选值: true, false

默认值: false

use_rephraser `boolean`

是否对输入文本提示词进行改写, 以优化效果, 正常状态建议保持开启

如果输入文本特别长且强诉求不能改变输入提示词内容且强诉求缩短耗时, 可关闭此参数

可选值: true, false

默认值: true

rephraser_level `string`

智能改写 prompt 的精细程度. 越精细模型对参考图和 prompt 指令的理解程度越高, 但对应的耗时也更高

需注意精细程度和生成效果并不一定是正比

general: 一般精细程度
fine: 精细程度
coarse: 粗糙程度

可选值: general, fine, coarse

默认值: general

seed `integer`

随机种子, 作为确定扩散初始状态的基础, 默认 -1（随机）. 若随机种子为相同正整数且其他参数均一致, 则生成内容极大概率效果一致

默认值: -1

width `integer`

生成图像的宽, 取值建议范围 512 到 2048

突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题

建议比例及对应宽高（width * height）：
1:1: 1328 * 1328
4:3: 1472 * 1104
3:2: 1584 * 1056
16:9: 1664 * 936
21:9: 2016 * 864

范围: 512 到 2048

默认值: 1328

height `integer`

生成图像的高, 取值建议范围 512 到 2048

突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题

范围: 512 到 2048

默认值: 1328

轮询

由于图像生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error `object`

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息

output `array`

生成结果. 仅在状态为 completed 时出现

content array

生成内容列表

type string

资源类型

值: image

url string

图像 URL

jobId string

远程任务 ID

usage `object`

使用统计. 仅在状态为 completed 时出现

cost string

总费用（美元）

discount number

折扣金额

metadata `object`

元数据信息

错误码

错误码	描述
003013001	缺少提示词
003013002	缺少图像
003013003	提示词长度无效
003013004	参数无效
003013095	内部生成错误
003013096	结果解析异常
003013097	HTTP 错误响应
003013098	状态检查异常
003013099	服务不可用

curl --location 'https://cloud.vtrix.ai/model/v1/generation' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer YOUR_API_KEY' \ --data '{ "model": "spark_multi_dreamo", "input": [ { "params": { "image_urls": ["https://example.com/image1.jpg", "https://example.com/image2.jpg"], "prompt": "保持角色特征一致的合照", "ref_type_list": ["ID", "STYLE"], "guidance_scale1": 2.5, "guidance_scale2": 2.5, "use_rephraser": true, "width": 1328, "height": 1328 } } ] }'

{ "id": "d5u5obte8783ap44qtj0", "created_at": 1769757744021, "status": "completed", "model": "spark_multi_dreamo", "output": [ { "content": [ { "type": "image", "url": "https://example.com/generated-image.jpg", "jobId": "remote_job_id_12345" } ] } ], "usage": { "cost": "0.000500", "discount": 0, "input_tokens": null, "output_tokens": null, "quantity": 1, "time_per_unit": 0, "total_tokens": null, "unit_price": "0.000500", "user_discount": 1 }, "metadata": { "completed_at": 120.5, "in_queue_at": 0, "upload_at": 1.2, "usage": { "input_tokens": 20, "input_tokens_details": { "text_tokens": 20 }, "output_tokens": 0, "total_tokens": 20 } } }

Spark DreamO - Multi IP

接口提示

认证

authorization `string` 必需

参数

model `string` 必需

binary_data_base64 `array` 必需（二选一）

image_urls `array` 必需（二选一）

prompt `string` 必需

ref_type_list `array`

guidance_scale1 `number`

guidance_scale2 `number`

ddim_steps `integer`

swap_face `boolean`

use_rephraser `boolean`

rephraser_level `string`

seed `integer`

width `integer`

height `integer`

轮询

响应格式

error `object`

code `string`

error_message `string`

output `array`

content `array`

type `string`

url `string`

jobId `string`

usage `object`

cost `string`

discount `number`

metadata `object`

错误码

接口提示

认证

authorization string 必需

参数

model string 必需

binary_data_base64 array 必需（二选一）

image_urls array 必需（二选一）

prompt string 必需

ref_type_list array

guidance_scale1 number

guidance_scale2 number

ddim_steps integer

swap_face boolean

use_rephraser boolean

rephraser_level string

seed integer

width integer

height integer

轮询

响应格式

error object

code string

error_message string

output array

content array

type string

url string

jobId string

usage object

cost string

discount number

metadata object

错误码

authorization `string` 必需

model `string` 必需

binary_data_base64 `array` 必需（二选一）

image_urls `array` 必需（二选一）

prompt `string` 必需

ref_type_list `array`

guidance_scale1 `number`

guidance_scale2 `number`

ddim_steps `integer`

swap_face `boolean`

use_rephraser `boolean`

rephraser_level `string`

seed `integer`

width `integer`

height `integer`

error `object`

code `string`

error_message `string`

output `array`

content `array`

type `string`

url `string`

jobId `string`

usage `object`

cost `string`

discount `number`

metadata `object`