Overview | Vtrix API Docs

OpenAI 提供先进的语言模型、推理模型和图像/视频生成能力, 在各种应用场景中表现卓越

可用模型

GPT-4o - OpenAI 的多功能多模态模型.比 GPT-4 Turbo 快 2 倍且便宜 50%, 同时保持相同的智能水平.在视觉任务、非英语语言和通用用途方面表现出色
GPT-4.1 - OpenAI 的旗舰编程和指令遵循模型.在 SWE-bench Verified 上达到 54.6%, IFEval 达到 87.4%, 拥有 1M token 上下文窗口.针对复杂的代理工作流和工具使用进行优化
GPT-4o Mini - 适用于高容量应用的经济高效多模态模型.快速响应且推理能力强.在聊天、摘要和分类方面性价比最高
GPT-5 - OpenAI 最先进的推理模型.具有专家级响应的动态推理, 幻觉减少约 80%.统一架构结合了 GPT-4 和 o 系列能力
GPT-4.1 Mini - 与 GPT-4o 相比成本更低的均衡模型.1M 上下文, 在困难指令评估上达到 45.1%.适用于编程、RAG 和代理应用
OpenAI o1 - OpenAI 首个具有思维链的推理模型.在 STEM、编程和复杂问题解决方面表现出色, 可调整推理力度
OpenAI o3 - OpenAI 最强大的推理模型.为数学、科学、编程和视觉推理设定新标准.在技术写作和复杂指令方面表现出色
GPT-4.1 Nano - GPT-4.1 系列中最小的模型, 具有卓越的效率.MMLU 达到 80.1%, GPQA 达到 50.3%.以最低成本提供 1M 上下文, 适用于嵌入和轻量级任务
Sora 2 - 来自 OpenAI 的 Sora 2 生成长达 20 秒的逼真视频, 对物理、运动和空间关系有卓越的理解.创建具有复杂相机运动的连贯场景
GPT Image 1 - GPT Image 1 是一个 AI 驱动的图像生成模型, 可从文本描述创建高质量图像
Sora2 Image to Video - Sora2 Image to Video 使用 Microsoft 的 Sora2 模型将静态图像转换为动态视频内容, 支持参考图像输入
Sora2 Text to Video - Sora2 Text to Video 使用 Microsoft 的 Sora2 模型直接从文本提示生成视频, 无需参考图像
GPT Image 1.5 - GPT Image 1.5 是一个增强的 AI 驱动图像生成模型, 具有改进的质量和创意能力
GPT-5.2 - OpenAI 最新旗舰模型, 具有 400K 上下文窗口和 128K 最大输出.提供三个变体:Instant(最快)、Thinking(可配置推理)和 Pro(最大推理).比 GPT-5 快 18%, 在 ARC-AGI-1 基准测试中达到 90%+ 的成绩