⌘K

Wan 2.6 - Image to Image

wan26_i2i

Wan 2.6 - Image to Image 通过 AI 驱动的风格迁移和修改功能来转换和编辑图像.

认证

authorization string 必填

所有 API 都需要通过 Bearer Token 进行认证.

获取 API Key:

访问 API Key 管理页面 获取您的 API Key

使用方法:

添加到请求头:

Authorization: Bearer YOUR_API_KEY

参数

model string 必填

请求使用的模型 ID

: wan26_i2i


input object 必填

生成请求的输入数据

messages array 必填

请求内容数组. 目前仅支持单轮对话, 即传递一组 role 和 content 参数. 不支持多轮对话. 数组长度必须为 1.

role string 必填

消息的角色

: user

content array 必填

内容数组, 必须包含一个 text 对象和 0-4 个 image 对象

text string 必填

正向提示词, 用于描述您期望生成的图像内容、风格和构图. 支持中英文. 每个中文字符、字母、数字或符号计为一个字符. 超出限制的内容将被自动截断.

最大长度:2000 个字符

image string

图像输入(可选)

基本限制:
支持格式:JPEG, JPG, PNG(无透明度), BMP, WEBP
分辨率要求:宽度和高度必须在 3845000 像素之间
文件大小:最大 10MB

图像数量规则:
图像数量取决于 parameters.enable_interleave 参数:
enable_interleave=true(交错输出):可输入 0-1 张图像
enable_interleave=false(图像编辑):必须输入 1-4 张图像

多图输入:输入多张图像时, 在 content 数组中传递多个 image 对象. 图像顺序由数组顺序定义.

输入格式:
方式 1:公开可访问的 URL
支持 HTTP 或 HTTPS 协议
示例:http://wanx.alicdn.com/material/xxx.jpeg

方式 2:Base64 编码
格式:data:{MIME_type};base64,{base64_data}
示例:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...


parameters object

图像处理参数

negative_prompt string

负向提示词, 用于描述您不希望出现在图像中的内容, 以约束输出. 支持中英文. 超出限制的内容将被自动截断.

最大长度:500 个字符

示例:低分辨率, 低质量, 变形的四肢, 变形的手指, 过饱和, 蜡质外观, 无面部细节, 过于光滑, AI 生成的外观, 混乱的构图, 模糊的文字, 扭曲.

size string

输出图像分辨率, 格式为 width*height.

对于 wan2.6-image:总像素必须在 [768×768, 1280×1280](即 589824 到 1638400 像素)之间, 宽高比必须在 [1:4, 4:1] 范围内. 例如, 1024×1536 符合要求.

常见宽高比的推荐分辨率:
1:1:1280×12801024×1024
2:3:800×1200
3:2:1200×800
3:4:960×1280
4:3:1280×960
9:16:720×1280
16:9:1280×720
21:9:1344×576

enable_interleave boolean

控制图像生成模式. 当设为 false 时为图像编辑模式, 支持多图输入和主体一致性生成, 可基于 1-4 张输入图像进行编辑、风格迁移或主体一致性生成, 必须提供至少 1 张参考图像, 输出 1 到 4 张结果图像. 当设为 true 时为交错文图输出模式, 仅支持传递一张图像或不传图像.

可选值: false, true

默认值: false

n integer

指定要生成的图像数量. 此参数直接影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.

此参数的值范围和含义取决于 enable_interleave 状态:当 enable_interleave=false(图像编辑模式)时, 直接控制生成的图像数量, 建议在测试时设为 1 以进行低成本效果验证;当 enable_interleave=true(交错模式)时, 此参数必须固定为 1, 设置为其他值将导致 API 错误, 在此模式下使用 max_images 参数控制生成图像的最大数量.

范围: 1 - 4

默认值: 1

max_images integer

指定模型在单次响应中生成的最大图像数量, 仅在交错模式下有效(即 enable_interleave=true). 此参数影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.

注意此参数仅表示「上限」, 实际生成的图像数量由模型推理决定, 可能少于设定值(例如设置为 5, 模型可能根据内容只生成 3 张图像).

范围: 1 - 5

默认值: 5

prompt_extend boolean

是否启用智能提示词改写, 仅在图像编辑模式下有效(即 enable_interleave=false). 此功能仅优化和完善正向提示词, 不会更改负向提示词.

可选值: true, false

默认值: true

watermark boolean

是否添加水印标识. 水印位于图像右下角, 固定文字为「AI Generated」.

可选值: false, true

默认值: false

seed integer

生成的随机种子. 使用相同的种子值可以保持生成内容相对稳定, 如果未提供则算法将自动使用随机种子.

注意: 模型生成过程是概率性的, 即使使用相同的种子也不能保证每次生成的结果完全一致.

范围: 0 - 2147483647


轮询

由于图像生成需要时间, 创建任务后需要轮询任务状态.

初始响应返回任务 ID 和初始状态. 实际生成结果必须通过轮询任务状态端点获取.


响应格式

error object

错误信息. 仅当状态为 failed 时存在.

code string

错误码

message string

详细错误信息


output array

生成结果. 仅当状态为 completed 时存在.

content array

生成内容列表

type string

资源类型

可选值: image, text

url string

生成的图像 URL. 仅当 type 为 image 时存在

text string

生成的文本内容. 仅当 type 为 text 时存在(交错模式)

jobId string

远程任务 ID


usage object

使用统计. 仅当状态为 completed 时存在.

cost string

总费用(美元)

discount number

折扣金额

image_count integer

生成的图像数量


metadata object

元数据信息.


错误码

错误码描述
001021001缺少必填字段 input
001021002input.messages 必须包含一条消息
001021003message.role 必须为 user
001021004message.content 必须为数组
001021005message.content 必须包含一个 text 对象
001021006文本长度必须在 1-2000 个字符之间
001021007当 enable_interleave=true 时, 只能输入 0-1 张图像
001021008当 enable_interleave=false 时, 必须输入 1-4 张图像
001021009negative_prompt 不能超过 500 个字符
001021010当 enable_interleave=true 时, n 必须为 1
001021011n 必须是 1 到 4 之间的整数
001021012max_images 仅在 enable_interleave=true 时有效
001021013max_images 必须是 1 到 5 之间的整数
001021014seed 必须是 0 到 2147483647 之间的整数
001021015size 格式必须为 ‘width*height’
001021016size 必须在 768*768 到 1280*1280 像素之间
001021017宽高比必须在 1:4 到 4:1 之间
001021018无效的 size 格式, 必须为 ‘width*height’ 且为整数
001021095内部生成错误
001021096结果解析错误
001021097HTTP 错误响应
001021098状态检查错误
001021099任务创建错误