⌘K

Spark Edit 3.0(将下线)

spark_edit_3_0

Spark Edit 3.0 图像编辑模型.支持基于文本提示词的智能图像编辑,编辑强度可调.

接口提示

输入图要求

图片格式: 仅支持 JPEG、PNG 格式, 建议使用 JPEG 格式

图片文件大小: 最大 5 MB, 图片分辨率:最大 4096 * 4096

长宽比: 长边与短边比例在 3 以内, 超出此比例或比例相对极端, 会导致报错

输出图说明

输出图分辨率与输入图宽高比有关, 与原始分辨率大小无关

最终出图宽高比与原图接近, 单边长度:[512, 1536]


认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID

: spark_edit_3_0


prompt string 必需

用于编辑图像的提示词

建议长度 ≤ 120 字符, 最长不超过 800 字符. prompt 过长有概率出图异常或不生效

编辑指令使用自然语言即可
每次编辑使用单指令会更好
局部编辑时指令描述尽量精准, 尤其是画面有多个实体的时候, 描述清楚对谁做什么, 能获取更精准的编辑效果
发现编辑效果不明显的时候, 可以调整一下编辑强度 scale, 数值越大越贴近指令执行
尽量使用清晰的、分辨率高的底图, 豆包模型生成的图片编辑效果会更好

参考示例:
添加/删除实体:添加/删除 xxx(删除图上的女孩 / 添加一道彩虹)
修改实体:把 xxx 改成 xxx(把手里的鸡腿变成汉堡)
修改风格:改成 xxx 风格(改成漫画风格)
修改色彩:把 xxx 改成 xx 颜色(把衣服改成粉色的)
修改动作:修改表情动作(让他哭/笑/生气)
修改环境背景:背景换成 xxx, 在 xxx(背景换成海边 / 在星空下)


image_urls array 必需(二选一)

图片文件 URL. 需输入 1 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


binary_data_base64 array 必需(二选一)

图片文件, Base64 编码. 需输入 1 张图片

image_urlsbinary_data_base64 二选一, 必须提供其中一个


seed integer

随机种子, 作为确定扩散初始状态的基础. 若随机种子为相同正整数且其他参数均一致, 则生成内容极大概率效果一致

默认值: -1(随机)


scale number

文本描述影响的程度, 该值越大代表文本描述影响程度越大, 且输入图片影响程度越小

范围: 0-1

默认值: 0.5


轮询

由于图像生成需要时间, 您需要在创建任务后轮询任务状态

初始响应返回任务 ID 和初始状态. 实际的生成结果必须通过轮询任务状态端点来获取

响应格式

error object

错误信息. 仅在状态为 failed 时出现

code string

错误码

error_message string

详细错误信息


output array

生成结果. 仅在状态为 completed 时出现

content array

生成内容列表

type string

资源类型

: image

url string

图像 URL

size integer

图像大小(字节)

jobId string

远程任务 ID


usage object

使用统计. 仅在状态为 completed 时出现

cost string

总费用(美元)

discount number

折扣金额


metadata object

元数据信息


错误码

错误码描述
3007001缺少提示词
3007002缺少图像
3007003图像格式无效
3007004提示词长度无效
3007005图像大小无效
3007006参数无效
3007007认证失败
3007008图像数组无效
3007009图像元素无效
3007095内部生成错误
3007096结果解析异常
3007097HTTP 错误响应
3007098状态检查异常
3007099服务不可用