⌘K

Spark DreamO - Multi IP

spark_multi_dreamo

Spark DreamO - Multi IP 多图像编辑模型.支持使用 1-5 张参考图像进行编辑,同时保持角色特征.

接口提示

输入的图片需要满足以下要求:

图片格式: 仅支持 JPEG、PNG 格式, 建议使用 JPEG 格式

图片文件大小: 最大 4.7 MB, 图片分辨率:最大 4096 * 4096

图片比例: 推荐范围为 16:99:16(极端比例效果欠佳, 有概率报错)


认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID

: spark_multi_dreamo


binary_data_base64 array 必需(二选一)

图片文件, Base64 编码. 最多支持输入 5 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


image_urls array 必需(二选一)

图片文件 URL(必须公网可正常访问). 最多支持输入 5 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


prompt string 必需

用于编辑图像的提示词, 支持中英双语, 长度建议控制在 300 字符左右, 过长会不生效且易引起异常


ref_type_list array

指定每张参考图的参考类型, 此数组长度必须等于参考图数量

参考类型默认值为 AUTO, 模型会自动匹配参考类型, 但会增加推理耗时. 建议在参考类型固定的场景中, 手动指定每张参考图的参考类型

IP: 参考主体特征
ID: 参考人脸特征
STYLE: 参考风格特征
AUTO: 自动匹配参考类型(默认值)

可选值: IP, ID, STYLE, AUTO

默认值: AUTO


guidance_scale1 number

控制生成结果对文本描述的一致性. 该参数越大, 文本一致性越高, 但图像一致性越低

范围: 1.07.0

默认值: 2.5


guidance_scale2 number

控制生成结果对图像的一致性. 该参数越大, 图像一致性越高, 但文本一致性越低

范围: 1.07.0

默认值: 2.5


ddim_steps integer

生成图像的步数

范围: 150

默认值: 12


swap_face boolean

是否使用脸部 ID 增强. 开启后人脸一致性更高, 但会影响表情、妆容等面部属性编辑, 并且会增加耗时

可选值: true, false

默认值: false


use_rephraser boolean

是否对输入文本提示词进行改写, 以优化效果, 正常状态建议保持开启

如果输入文本特别长且强诉求不能改变输入提示词内容且强诉求缩短耗时, 可关闭此参数

可选值: true, false

默认值: true


rephraser_level string

智能改写 prompt 的精细程度. 越精细模型对参考图和 prompt 指令的理解程度越高, 但对应的耗时也更高

需注意精细程度和生成效果并不一定是正比

general: 一般精细程度
fine: 精细程度
coarse: 粗糙程度

可选值: general, fine, coarse

默认值: general


seed integer

随机种子, 作为确定扩散初始状态的基础, 默认 -1(随机). 若随机种子为相同正整数且其他参数均一致, 则生成内容极大概率效果一致

默认值: -1


width integer

生成图像的宽, 取值建议范围 5122048

突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题

建议比例及对应宽高(width * height):
1:1: 1328 * 1328
4:3: 1472 * 1104
3:2: 1584 * 1056
16:9: 1664 * 936
21:9: 2016 * 864

范围: 5122048

默认值: 1328


height integer

生成图像的高, 取值建议范围 5122048

突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题

范围: 5122048

默认值: 1328


轮询

由于图像生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error object

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息


output array

生成结果. 仅在状态为 completed 时出现

content array

生成内容列表

type string

资源类型

: image

url string

图像 URL

jobId string

远程任务 ID


usage object

使用统计. 仅在状态为 completed 时出现

cost string

总费用(美元)

discount number

折扣金额


metadata object

元数据信息


错误码

错误码描述
003013001缺少提示词
003013002缺少图像
003013003提示词长度无效
003013004参数无效
003013095内部生成错误
003013096结果解析异常
003013097HTTP 错误响应
003013098状态检查异常
003013099服务不可用