OpenAI 发布 GPT-5.5:能力升级伴随 API 价格翻倍

4 月 23 日,OpenAI 在官方博客发布新一代旗舰模型 GPT-5.5,并面向 ChatGPT Plus、Pro、Business、Enterprise 订阅用户开放,编程助手 Codex 同步上线。模型 API 与 GPT-5.5 Pro 版本于 4 月 24 日在 Responses 与 Chat Completions 接口上线。OpenAI 在公告中称 GPT-5.5 是公司「最聪明、最直观」的模型,重点强化了代理式(agentic)编程、计算机操作、知识工作和早期科研四个方向。
在 OpenAI 给出的基准测试中,GPT-5.5 在 SWE-Bench Pro 真实 GitHub Issue 修复任务上得分 58.6%,在测试复杂命令行工作流的 Terminal-Bench 2.0 上达到 82.7%,在跨 44 类职业知识工作的 GDPval 上为 84.9%,计算机操作 OSWorld-Verified 为 78.7%,电信客服流程 Tau2-bench Telecom 为 98.0%。模型在 API 中支持 100 万 token 上下文窗口,Codex 内为 40 万 token。

价格层面,GPT-5.5 标准版 API 定价为输入每百万 token 5 美元、输出 30 美元,相比 GPT-5.4 的 2.5 美元 / 15 美元正好翻倍。GPT-5.5 Pro 定价更高,为输入 30 美元、输出 180 美元。OpenAI 同时提供 Batch 与 Flex 五折档,以及 Priority 处理 2.5 倍加价档。OpenAI 在博客中表示:「尽管价格更高,GPT-5.5 在多数任务上更高效、所需 token 更少。」
独立模型测评机构 Artificial Analysis 在评测后表示,把代币效率提升纳入考虑后,GPT-5.5 完成同等任务的实际 API 成本约比 GPT-5.4 高出 20%,「翻倍的标价被更低的代币消耗部分抵消」。科技媒体 The Decoder 也指出,GDPval 这类衡量真实职场任务表现的指标,GPT-5.5 相对 GPT-5.4 仅从 83.0% 提升到 84.9%,单项进步幅度有限。
竞争层面,TechCrunch 援引 OpenAI 发布会信息称,GPT-5.5 在多个评测中超越 Google 的 Gemini 3.1 Pro 与 Anthropic 的 Claude Opus 4.5。但据测评网站 LLM-Stats 公布的数据,在 SWE-Bench Pro 单项上,Claude Opus 4.7 以 64.3% 领先 GPT-5.5 的 58.6%,差距 5.7 个百分点,编程基准上的最强位置仍未被一家独占。OpenAI 联合创始人 Greg Brockman 在公告中称,GPT-5.5 代表了「迈向更具代理性、更直观的计算」的进展。
渠道层面,与发布同步,OpenAI 宣布将 GPT-5.5 等前沿模型上架 Amazon Bedrock,并把 Codex 引入 AWS,新增由 OpenAI 模型驱动的 Bedrock Managed Agents,让企业客户可在既有 AWS 安全与治理框架内使用其模型。Codex 也覆盖到 ChatGPT Plus、Pro、Business、Enterprise、Edu 与 Go 全部订阅档。
Comments
0Sign in to join the discussion.
Go to sign in