⌘K

Spark Image to Image 3.0

spark_i2i_3_0

保持结构的图像到图像生成, 可以在不破坏原始主体的情况下进行受控的视觉编辑.

接口提示

输入图要求

图片格式: 仅支持 JPEG、PNG 格式, 建议使用 JPEG 格式

图片文件大小: 最大 4.7 MB, 图片分辨率:最大 4096 * 4096

长宽比: 长边与短边比例在 3 以内, 超出此比例或比例相对极端, 会导致报错

输出图说明

输出图范围在 [512, 1536]

输出图详细宽高规则, 参考下方 widthheight 中参数描述


认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID

: spark_i2i_3_0


prompt string 必需

用于编辑图像的提示词

建议长度 ≤ 120 字符, 最长不超过 800 字符. prompt 过长有概率出图异常或不生效

如果图片应用于设计、营销等场景, 可在 prompt 中加入”海报、平面设计”等词, 模型会在该类场景有所增强(例如: 平面设计, 一只小狗在马路上奔跑)
prompt 中用引号将希望书写的文字引起来, 文字准确率会更高(例如: 一张圣诞节卡片, 上面写着”Merry Christmas”)
编辑指令使用自然语言即可
每次编辑使用单指令会更好
局部编辑时指令描述尽量精准, 尤其是画面有多个实体的时候, 描述清楚对谁做什么, 能获取更精准的编辑效果
发现编辑效果不明显的时候, 可以调整一下编辑强度 scale, 数值越大越贴近指令执行
尽量使用清晰的、分辨率高的底图, 效果会更好

参考示例:
添加/删除实体:添加/删除 xxx(删除图上的女孩 / 添加一道彩虹)
修改实体:把 xxx 改成 xxx(把手里的鸡腿变成汉堡)
修改风格:改成 xxx 风格(改成漫画风格)
修改色彩:把 xxx 改成 xx 颜色(把衣服改成粉色的)
修改动作:修改表情动作(让他哭/笑/生气)
修改环境背景:背景换成 xxx, 在 xxx(背景换成海边 / 在星空下)


image_urls array 必需(二选一)

图片文件 URL. 需输入 1 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


binary_data_base64 array 必需(二选一)

图片文件 Base64 编码. 需输入 1 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


seed integer

随机种子, 作为确定扩散初始状态的基础. 若随机种子为相同正整数且其他参数均一致, 则生成内容极大概率效果一致

默认值: -1(随机)


scale number

文本描述影响的程度, 该值越大代表文本描述影响程度越大, 且输入图片影响程度越小

范围: 0-1

默认值: 0.5


width integer

生成图像的宽

系统默认生成 1328 × 1328 的图像

支持自定义生成图像宽高, 范围在 [512, 2016] 内

推荐可选的宽高比:
1328 × 1328(1:1)
1472 × 1104(4:3)
1584 × 1056(3:2)
1664 × 936(16:9)
2016 × 864(21:9)

注意: 需同时传 width 和 height 才会生效

默认值: 1328


height integer

生成图像的高

注意:
需同时传 width 和 height 才会生效
如果自定义生图宽高都比 1024 小很多(如: 600 以下)可能出图全黑, 建议优先设置接近 1024 的生图宽高
最终输出图宽高与传入宽高相关但不完全相等, 为”与传入宽高最接近 16 整数倍”的像素值, 范围在 [512, 1536] 内

默认值: 1328


轮询

由于图像生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error object

错误信息. 仅在状态为 failed 时出现

code integer

错误码

error_message string

详细错误信息


output array

生成结果. 仅在状态为 completed 时出现

content array

生成的图像内容列表

type string

资源类型

: image

url string

生成的图像 URL

size integer

文件大小(字节)

jobId string

作业 ID


usage object

使用统计. 仅在状态为 completed 时出现

cost string

总费用(美元)

discount number

折扣金额

input_tokens integer

输入令牌数

output_tokens integer

输出令牌数

total_tokens integer

总令牌数

generated_images integer

生成的图像数量


错误码

错误码描述
003003001缺少提示词
003003002无效的提示词长度
003003003缺少图像
003003004无效的图像数量
003003005无效的种子值
003003006无效的缩放因子
003003007无效的尺寸
003003008图像来源冲突
003003009无效的图像数组
003003095内部生成错误
003003096结果解析错误
003003097HTTP 错误响应
003003098状态检查错误
003003099任务创建错误