认证
authorization string 必填
所有 API 均使用 Bearer Token 鉴权
获取 API Key:
访问 API Key 管理页面 获取 API Key
用法:
将以下 Header 添加到请求中:
Authorization: Bearer YOUR_API_KEY
参数
model string 必填
请求使用的模型 ID
值: wan26_image_intl
input object 必填
生成请求的输入数据
messages
array必填请求内容数组. 目前仅支持单轮对话, 即传入一组 role 和 content 参数. 不支持多轮对话. 数组长度必须为
1.role
string必填消息的角色
值:
usercontent
array必填内容数组, 必须包含恰好一个 text 对象和 0–4 个 image 对象
text
string必填正向提示词, 用于描述您期望生成的图像内容、风格和构图. 支持中英文. 每个中文字符、字母、数字或符号计为一个字符. 超出限制的内容将被自动截断.
最大长度:
2000个字符image
string输入图像的 URL 或 Base64 编码字符串.
基本限制:
支持格式:JPEG, JPG, PNG(不支持透明通道), BMP, WEBP
分辨率要求:宽度和高度必须在240到8000像素之间
文件大小:最大10MB图像数量规则:
图像数量取决于parameters.enable_interleave参数:
当enable_interleave=true(图文混排输出)时:可输入 0–1 张图像
当enable_interleave=false(图像编辑)时:必须输入 1–4 张图像多图输入:在 content 数组中传入多个 image 对象. 图像顺序由数组顺序定义.
输入格式:
方式 1:公开可访问的 URL(HTTP 或 HTTPS)
示例:http://wanx.alicdn.com/material/xxx.jpeg方式 2:Base64 编码
格式:data:{MIME_type};base64,{base64_data}
示例:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...
parameters object
图像处理参数
negative_prompt
string反向提示词, 用于描述不希望在图像中出现的内容. 支持中英文. 超出限制的内容将被自动截断.
最大长度:
500个字符示例:
低分辨率, 低画质, 肢体畸形, 手指畸形, 画面过饱和, 蜡像感, 人脸无细节, 过度光滑, 画面具有AI感, 构图混乱, 文字模糊, 扭曲.
size
string输出图像分辨率. 行为取决于
enable_interleave模式.图像编辑模式(
enable_interleave=false):
方式 1——参考档位(推荐):1K(默认, 总像素接近 1280×1280)或2K(总像素接近 2048×2048). 宽高比与最后一张输入图像一致.
方式 2——指定像素值:总像素在[768×768, 2048×2048]之间, 宽高比在[1:4, 4:1]范围内. 实际输出像素值为最接近指定值的 16 的倍数.图文混排输出模式(
enable_interleave=true):
方式 1——跟随输入:若输入总像素 ≤ 1280×1280, 输出与输入一致;若输入总像素 > 1280×1280, 输出接近 1280×1280. 若无输入图像, 默认为 1280×1280.
方式 2——指定像素值:总像素在[768×768, 1280×1280]之间, 宽高比在[1:4, 4:1]范围内.常见宽高比推荐分辨率:
1:1:1280×1280
2:3:800×1200
3:2:1200×800
3:4:960×1280
4:3:1280×960
9:16:720×1280
16:9:1280×720
21:9:1344×576默认值:
1K
enable_interleave
boolean控制图像生成模式.
false:图像编辑模式——支持多图输入和主体一致性生成. 需提供 1–4 张参考图像. 可输出 1–4 张结果图像.
true:图文混排输出模式——支持传入 0 或 1 张图像. 用于生成图文混合内容或纯文生图.可选值:
false,true默认值:
false
n
integer指定要生成的图像数量. 此参数直接影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.
当
enable_interleave=false(图像编辑模式)时:直接控制生成图像的数量, 建议在测试阶段设置为1以进行低成本效果验证.当
enable_interleave=true(图文混排模式)时:必须固定为1, 设置为其他值将导致接口报错. 如需控制生成图像数量上限, 请使用max_images参数.范围:
1-4默认值:
1
max_images
integer指定模型在单次响应中生成图像的最大数量, 仅在图文混排模式下有效(即
enable_interleave=true). 此参数影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.该参数仅代表「数量上限」. 实际生成的图像数量由模型推理决定, 可能少于设定值(例如设置为
5, 模型可能根据内容仅生成3张).范围:
1-5默认值:
5
prompt_extend
boolean是否开启 prompt 智能改写功能, 仅在图像编辑模式下有效(即
enable_interleave=false). 该功能仅对正向提示词进行优化与润色, 不会改变反向提示词.可选值:
true,false默认值:
true
watermark
boolean是否添加水印标识. 水印位于图像右下角, 文案固定为「AI生成」.
可选值:
false,true默认值:
false
seed
integer随机数种子. 使用相同的 seed 值可使生成内容保持相对稳定. 若不提供, 算法将自动使用随机种子.
注意: 模型生成过程具有概率性, 即使使用相同的 seed 也不能保证每次生成结果完全一致.
范围:
0-2147483647
轮询
由于结果生成需要时间,您需要在创建任务后轮询任务状态
初始响应只返回任务 ID 和初始状态等信息,最终生成结果需通过使用该任务 ID 轮询任务状态接口获取
轮询请求与响应示例见右侧
响应格式
error object
错误信息, 仅在状态为 failed 时存在
code
string错误码
message
string详细错误信息
output array
生成结果, 仅在状态为 completed 时存在
content
array生成的资源内容列表
type
string资源类型
值:
image|videourl
string处理后的资源 URL
jobId
string远端任务 ID
usage object
使用统计, 仅在状态为 completed 时存在
cost
string总费用(美元)
discount
number折扣金额
metadata object
元数据信息