⌘K

Wan 2.6 Image (International)

wan26_image_intl

Wan2.6 Image 是阿里巴巴最新的图像编辑模型, 可基于文本提示词对输入图像进行变换与编辑, 通过国际(新加坡)节点提供服务.

认证

authorization string 必填

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必填

请求使用的模型 ID

值: wan26_image_intl


input object 必填

生成请求的输入数据

messages array 必填

请求内容数组. 目前仅支持单轮对话, 即传入一组 role 和 content 参数. 不支持多轮对话. 数组长度必须为 1.

role string 必填

消息的角色

值: user

content array 必填

内容数组, 必须包含恰好一个 text 对象和 0–4 个 image 对象

text string 必填

正向提示词, 用于描述您期望生成的图像内容、风格和构图. 支持中英文. 每个中文字符、字母、数字或符号计为一个字符. 超出限制的内容将被自动截断.

最大长度:2000 个字符

image string

输入图像的 URL 或 Base64 编码字符串.

基本限制:
支持格式:JPEG, JPG, PNG(不支持透明通道), BMP, WEBP
分辨率要求:宽度和高度必须在 2408000 像素之间
文件大小:最大 10MB

图像数量规则:
图像数量取决于 parameters.enable_interleave 参数:
enable_interleave=true(图文混排输出)时:可输入 0–1 张图像
enable_interleave=false(图像编辑)时:必须输入 1–4 张图像

多图输入:在 content 数组中传入多个 image 对象. 图像顺序由数组顺序定义.

输入格式:
方式 1:公开可访问的 URL(HTTP 或 HTTPS)
示例:http://wanx.alicdn.com/material/xxx.jpeg

方式 2:Base64 编码
格式:data:{MIME_type};base64,{base64_data}
示例:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...


parameters object

图像处理参数

negative_prompt string

反向提示词, 用于描述不希望在图像中出现的内容. 支持中英文. 超出限制的内容将被自动截断.

最大长度:500 个字符

示例:低分辨率, 低画质, 肢体畸形, 手指畸形, 画面过饱和, 蜡像感, 人脸无细节, 过度光滑, 画面具有AI感, 构图混乱, 文字模糊, 扭曲.

size string

输出图像分辨率. 行为取决于 enable_interleave 模式.

图像编辑模式enable_interleave=false):
方式 1——参考档位(推荐):1K(默认, 总像素接近 1280×1280)或 2K(总像素接近 2048×2048). 宽高比与最后一张输入图像一致.
方式 2——指定像素值:总像素在 [768×768, 2048×2048] 之间, 宽高比在 [1:4, 4:1] 范围内. 实际输出像素值为最接近指定值的 16 的倍数.

图文混排输出模式enable_interleave=true):
方式 1——跟随输入:若输入总像素 ≤ 1280×1280, 输出与输入一致;若输入总像素 > 1280×1280, 输出接近 1280×1280. 若无输入图像, 默认为 1280×1280.
方式 2——指定像素值:总像素在 [768×768, 1280×1280] 之间, 宽高比在 [1:4, 4:1] 范围内.

常见宽高比推荐分辨率:
1:1:1280×1280
2:3:800×1200
3:2:1200×800
3:4:960×1280
4:3:1280×960
9:16:720×1280
16:9:1280×720
21:9:1344×576

默认值: 1K

enable_interleave boolean

控制图像生成模式.

false:图像编辑模式——支持多图输入和主体一致性生成. 需提供 1–4 张参考图像. 可输出 1–4 张结果图像.

true:图文混排输出模式——支持传入 0 或 1 张图像. 用于生成图文混合内容或纯文生图.

可选值: false, true

默认值: false

n integer

指定要生成的图像数量. 此参数直接影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.

enable_interleave=false(图像编辑模式)时:直接控制生成图像的数量, 建议在测试阶段设置为 1 以进行低成本效果验证.

enable_interleave=true(图文混排模式)时:必须固定为 1, 设置为其他值将导致接口报错. 如需控制生成图像数量上限, 请使用 max_images 参数.

范围: 1 - 4

默认值: 1

max_images integer

指定模型在单次响应中生成图像的最大数量, 仅在图文混排模式下有效(即 enable_interleave=true). 此参数影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.

该参数仅代表「数量上限」. 实际生成的图像数量由模型推理决定, 可能少于设定值(例如设置为 5, 模型可能根据内容仅生成 3 张).

范围: 1 - 5

默认值: 5

prompt_extend boolean

是否开启 prompt 智能改写功能, 仅在图像编辑模式下有效(即 enable_interleave=false). 该功能仅对正向提示词进行优化与润色, 不会改变反向提示词.

可选值: true, false

默认值: true

watermark boolean

是否添加水印标识. 水印位于图像右下角, 文案固定为「AI生成」.

可选值: false, true

默认值: false

seed integer

随机数种子. 使用相同的 seed 值可使生成内容保持相对稳定. 若不提供, 算法将自动使用随机种子.

注意: 模型生成过程具有概率性, 即使使用相同的 seed 也不能保证每次生成结果完全一致.

范围: 0 - 2147483647


轮询

由于结果生成需要时间,您需要在创建任务后轮询任务状态

初始响应只返回任务 ID 和初始状态等信息,最终生成结果需通过使用该任务 ID 轮询任务状态接口获取

轮询请求与响应示例见右侧


响应格式

error object

错误信息, 仅在状态为 failed 时存在

code string

错误码

message string

详细错误信息


output array

生成结果, 仅在状态为 completed 时存在

content array

生成的资源内容列表

type string

资源类型

值: image|video

url string

处理后的资源 URL

jobId string

远端任务 ID


usage object

使用统计, 仅在状态为 completed 时存在

cost string

总费用(美元)

discount number

折扣金额


metadata object

元数据信息