接口提示
输入的图片需要满足以下要求:
图片格式: 仅支持 JPEG、PNG 格式, 建议使用 JPEG 格式
图片文件大小: 最大 4.7 MB, 图片分辨率:最大 4096 * 4096
图片比例: 推荐范围为 16:9 到 9:16(极端比例效果欠佳, 有概率报错)
认证
authorization string 必需
所有 API 均使用 Bearer Token 鉴权
获取 API Key:
访问 API Key 管理页面 获取 API Key
用法:
将以下 Header 添加到请求中:
Authorization: Bearer YOUR_API_KEY
参数
model string 必需
请求使用的模型 ID
值: spark_multi_dreamo
binary_data_base64 array 必需(二选一)
图片文件, Base64 编码. 最多支持输入 5 张图片
image_urls 和 binary_data_base64 二选一, 必须提供其中一个
image_urls array 必需(二选一)
图片文件 URL(必须公网可正常访问). 最多支持输入 5 张图片
image_urls 和 binary_data_base64 二选一, 必须提供其中一个
prompt string 必需
用于编辑图像的提示词, 支持中英双语, 长度建议控制在 300 字符左右, 过长会不生效且易引起异常
ref_type_list array
指定每张参考图的参考类型, 此数组长度必须等于参考图数量
参考类型默认值为 AUTO, 模型会自动匹配参考类型, 但会增加推理耗时. 建议在参考类型固定的场景中, 手动指定每张参考图的参考类型
IP: 参考主体特征
ID: 参考人脸特征
STYLE: 参考风格特征
AUTO: 自动匹配参考类型(默认值)
可选值: IP, ID, STYLE, AUTO
默认值: AUTO
guidance_scale1 number
控制生成结果对文本描述的一致性. 该参数越大, 文本一致性越高, 但图像一致性越低
范围: 1.0 到 7.0
默认值: 2.5
guidance_scale2 number
控制生成结果对图像的一致性. 该参数越大, 图像一致性越高, 但文本一致性越低
范围: 1.0 到 7.0
默认值: 2.5
ddim_steps integer
生成图像的步数
范围: 1 到 50
默认值: 12
swap_face boolean
是否使用脸部 ID 增强. 开启后人脸一致性更高, 但会影响表情、妆容等面部属性编辑, 并且会增加耗时
可选值: true, false
默认值: false
use_rephraser boolean
是否对输入文本提示词进行改写, 以优化效果, 正常状态建议保持开启
如果输入文本特别长且强诉求不能改变输入提示词内容且强诉求缩短耗时, 可关闭此参数
可选值: true, false
默认值: true
rephraser_level string
智能改写 prompt 的精细程度. 越精细模型对参考图和 prompt 指令的理解程度越高, 但对应的耗时也更高
需注意精细程度和生成效果并不一定是正比
general: 一般精细程度
fine: 精细程度
coarse: 粗糙程度
可选值: general, fine, coarse
默认值: general
seed integer
随机种子, 作为确定扩散初始状态的基础, 默认 -1(随机). 若随机种子为相同正整数且其他参数均一致, 则生成内容极大概率效果一致
默认值: -1
width integer
生成图像的宽, 取值建议范围 512 到 2048
突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题
建议比例及对应宽高(width * height):
1:1: 1328 * 1328
4:3: 1472 * 1104
3:2: 1584 * 1056
16:9: 1664 * 936
21:9: 2016 * 864
范围: 512 到 2048
默认值: 1328
height integer
生成图像的高, 取值建议范围 512 到 2048
突破宽高上限, 需要保证宽 * 高乘积小于 2048 * 2048, 且易造成效果异常、超时等问题
范围: 512 到 2048
默认值: 1328
轮询
由于图像生成需要时间, 您需要在创建任务后轮询任务状态
初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取
响应格式
error object
错误信息. 仅在状态为 failed 时出现
code
string错误码
error_message
string详细错误信息
output array
生成结果. 仅在状态为 completed 时出现
content
array生成内容列表
type
string资源类型
值:
imageurl
string图像 URL
jobId
string远程任务 ID
usage object
使用统计. 仅在状态为 completed 时出现
cost
string总费用(美元)
discount
number折扣金额
metadata object
元数据信息
错误码
| 错误码 | 描述 |
|---|---|
| 003013001 | 缺少提示词 |
| 003013002 | 缺少图像 |
| 003013003 | 提示词长度无效 |
| 003013004 | 参数无效 |
| 003013095 | 内部生成错误 |
| 003013096 | 结果解析异常 |
| 003013097 | HTTP 错误响应 |
| 003013098 | 状态检查异常 |
| 003013099 | 服务不可用 |