⌘K

GLM-4.7

vtrix-glm-4.7

开源 MoE 模型, 总共 355B/32B 活跃参数.200K 上下文窗口, 131K 最大输出.具有三种思考模式(交错、保留、轮次级别).强大的编码性能:SWE-bench 上 73.8%, 出色的多语言编码支持

认证

authorization string 必需

所有 API 均使用 Bearer Token 鉴权

获取 API Key:

访问 API Key 管理页面 获取 API Key

用法:

将以下 Header 添加到请求中:

Authorization: Bearer YOUR_API_KEY

参数

model string 必需

请求使用的模型 ID.

值: vtrix-glm-4.7


messages array 必需

消息对象数组


messages[].role string 必需

消息角色

选项: user, assistant, system, developer


messages[].content string/array 必需

文本字符串或多模态数组


max_tokens integer

生成的最大 token 数

范围: 1-131072


temperature number

采样温度

范围: 0.0-2.0

默认值: 1.0


top_p number

核采样参数

范围: 0.0-1.0

默认值: 1.0


stream boolean

增量流式响应

选项: true, false

默认值: false


响应格式

id string

完成的唯一标识符


object string

对象类型, 始终为 chat.completion


created integer

创建时间的 Unix 时间戳


model string

用于完成的模型


choices array

完成选择数组

index integer

选择索引

message object

生成的消息

role string

消息角色(始终为 assistant)

content string

生成的文本内容

finish_reason string

完成终止的原因


usage object

token 使用统计

prompt_tokens integer

提示词中的 token 数

completion_tokens integer

完成中的 token 数

total_tokens integer

使用的总 token 数