认证
authorization string 必填
所有 API 都需要通过 Bearer Token 进行认证.
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用方法:
添加到请求头:
Authorization: Bearer YOUR_API_KEY
参数
model string 必填
请求使用的模型 ID
值: wan26_i2i
input object 必填
生成请求的输入数据
messages
array必填请求内容数组. 目前仅支持单轮对话, 即传递一组 role 和 content 参数. 不支持多轮对话. 数组长度必须为
1.role
string必填消息的角色
值:
usercontent
array必填内容数组, 必须包含一个 text 对象和 0-4 个 image 对象
text
string必填正向提示词, 用于描述您期望生成的图像内容、风格和构图. 支持中英文. 每个中文字符、字母、数字或符号计为一个字符. 超出限制的内容将被自动截断.
最大长度:
2000个字符image
string图像输入(可选)
基本限制:
支持格式:JPEG, JPG, PNG(无透明度), BMP, WEBP
分辨率要求:宽度和高度必须在384到5000像素之间
文件大小:最大10MB图像数量规则:
图像数量取决于parameters.enable_interleave参数:
当enable_interleave=true(交错输出):可输入 0-1 张图像
当enable_interleave=false(图像编辑):必须输入 1-4 张图像多图输入:输入多张图像时, 在 content 数组中传递多个 image 对象. 图像顺序由数组顺序定义.
输入格式:
方式 1:公开可访问的 URL
支持 HTTP 或 HTTPS 协议
示例:http://wanx.alicdn.com/material/xxx.jpeg方式 2:Base64 编码
格式:data:{MIME_type};base64,{base64_data}
示例:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...
parameters object
图像处理参数
negative_prompt
string负向提示词, 用于描述您不希望出现在图像中的内容, 以约束输出. 支持中英文. 超出限制的内容将被自动截断.
最大长度:
500个字符示例:
低分辨率, 低质量, 变形的四肢, 变形的手指, 过饱和, 蜡质外观, 无面部细节, 过于光滑, AI 生成的外观, 混乱的构图, 模糊的文字, 扭曲.
size
string输出图像分辨率, 格式为
width*height.对于 wan2.6-image:总像素必须在
[768×768, 1280×1280](即 589824 到 1638400 像素)之间, 宽高比必须在[1:4, 4:1]范围内. 例如,1024×1536符合要求.常见宽高比的推荐分辨率:
1:1:1280×1280或1024×1024
2:3:800×1200
3:2:1200×800
3:4:960×1280
4:3:1280×960
9:16:720×1280
16:9:1280×720
21:9:1344×576
enable_interleave
boolean控制图像生成模式. 当设为
false时为图像编辑模式, 支持多图输入和主体一致性生成, 可基于 1-4 张输入图像进行编辑、风格迁移或主体一致性生成, 必须提供至少 1 张参考图像, 输出 1 到 4 张结果图像. 当设为true时为交错文图输出模式, 仅支持传递一张图像或不传图像.可选值:
false,true默认值:
false
n
integer指定要生成的图像数量. 此参数直接影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.
此参数的值范围和含义取决于
enable_interleave状态:当enable_interleave=false(图像编辑模式)时, 直接控制生成的图像数量, 建议在测试时设为1以进行低成本效果验证;当enable_interleave=true(交错模式)时, 此参数必须固定为1, 设置为其他值将导致 API 错误, 在此模式下使用max_images参数控制生成图像的最大数量.范围:
1-4默认值:
1
max_images
integer指定模型在单次响应中生成的最大图像数量, 仅在交错模式下有效(即
enable_interleave=true). 此参数影响计费成本(成本 = 单价 × 成功生成的图像数量), 请在调用前确认模型定价.注意此参数仅表示「上限」, 实际生成的图像数量由模型推理决定, 可能少于设定值(例如设置为
5, 模型可能根据内容只生成3张图像).范围:
1-5默认值:
5
prompt_extend
boolean是否启用智能提示词改写, 仅在图像编辑模式下有效(即
enable_interleave=false). 此功能仅优化和完善正向提示词, 不会更改负向提示词.可选值:
true,false默认值:
true
watermark
boolean是否添加水印标识. 水印位于图像右下角, 固定文字为「AI Generated」.
可选值:
false,true默认值:
false
seed
integer生成的随机种子. 使用相同的种子值可以保持生成内容相对稳定, 如果未提供则算法将自动使用随机种子.
注意: 模型生成过程是概率性的, 即使使用相同的种子也不能保证每次生成的结果完全一致.
范围:
0-2147483647
轮询
由于图像生成需要时间, 创建任务后需要轮询任务状态.
初始响应返回任务 ID 和初始状态. 实际生成结果必须通过轮询任务状态端点获取.
响应格式
error object
错误信息. 仅当状态为 failed 时存在.
code
string错误码
message
string详细错误信息
output array
生成结果. 仅当状态为 completed 时存在.
content
array生成内容列表
type
string资源类型
可选值:
image,texturl
string生成的图像 URL. 仅当 type 为
image时存在text
string生成的文本内容. 仅当 type 为
text时存在(交错模式)jobId
string远程任务 ID
usage object
使用统计. 仅当状态为 completed 时存在.
cost
string总费用(美元)
discount
number折扣金额
image_count
integer生成的图像数量
metadata object
元数据信息.
错误码
| 错误码 | 描述 |
|---|---|
| 001021001 | 缺少必填字段 input |
| 001021002 | input.messages 必须包含一条消息 |
| 001021003 | message.role 必须为 user |
| 001021004 | message.content 必须为数组 |
| 001021005 | message.content 必须包含一个 text 对象 |
| 001021006 | 文本长度必须在 1-2000 个字符之间 |
| 001021007 | 当 enable_interleave=true 时, 只能输入 0-1 张图像 |
| 001021008 | 当 enable_interleave=false 时, 必须输入 1-4 张图像 |
| 001021009 | negative_prompt 不能超过 500 个字符 |
| 001021010 | 当 enable_interleave=true 时, n 必须为 1 |
| 001021011 | n 必须是 1 到 4 之间的整数 |
| 001021012 | max_images 仅在 enable_interleave=true 时有效 |
| 001021013 | max_images 必须是 1 到 5 之间的整数 |
| 001021014 | seed 必须是 0 到 2147483647 之间的整数 |
| 001021015 | size 格式必须为 ‘width*height’ |
| 001021016 | size 必须在 768*768 到 1280*1280 像素之间 |
| 001021017 | 宽高比必须在 1:4 到 4:1 之间 |
| 001021018 | 无效的 size 格式, 必须为 ‘width*height’ 且为整数 |
| 001021095 | 内部生成错误 |
| 001021096 | 结果解析错误 |
| 001021097 | HTTP 错误响应 |
| 001021098 | 状态检查错误 |
| 001021099 | 任务创建错误 |