OpenAI发布GPT-5.5：更贵的模型，更窄的战场

首页 > 全球 > 正文

2026-04-24 19:41:03 21世纪经济报道 21财经APP 董静怡

21世纪经济报道记者董静怡

4月24日凌晨，OpenAI发布了其最新一代大模型 GPT-5.5，距离上一次重大更新仅过去一个多月。

OpenAI团队认为，“这是我们迄今为止最智能、最直观易用的模型，也是迈向在计算机上完成工作的全新方式的重要一步。”

似乎是为了证明这款产品的颠覆性，OpenAI在介绍中引用了一位英伟达工程师的内测感受：“失去GPT-5.5，就像被截肢。”

上月，OpenAI宣布完成规模达1220亿美元的私募融资，估值高达8520亿美元，创下全球AI企业估值新纪录。但企业市场上，OpenAI的市场份额正被Anthropic以惊人的速度蚕食，随后OpenAI又忍痛砍掉了曾轰动世界的视频生成项目Sora，并进行了一场伤筋动骨的业务重组。

在2026年的这个时间节点，对于OpenAI来说挑战不小。看起来像是常规技术迭代的发布，底色更像一场自救。

更强、更快、也更贵

回顾生成式 AI 过去几年的发展历程，用户早已习惯了一个潜规则：每一次模型升级，几乎都伴随着不可忽视的“变慢”和“变贵”。更大的参数量、更长的思考时间，似乎是为“智能”支付的隐性代价。

但 GPT-5.5 的主打卖点，恰恰是打破了这条铁律。

OpenAI宣称，在真实的生产环境中，GPT-5.5 不仅智能水平大幅跃升，其每Token延迟与上一代GPT-5.4基本持平，甚至由于推理效率的优化，完成同样的复杂任务所需的Token数量反而更少。

在具体能力上，据介绍，GPT‑5.5 是OpenAI迄今为止最强的智能体编码模型。在测试复杂命令行工作流的Terminal-Bench 2.0上，它取得了82.7%的当前最优准确率。在评估真实GitHub问题解决能力的SWE-Bench Pro上，它的准确率达到58.6%，一次性端到端解决的任务数量超过了以往的模型。

其在编码方面的优势在Codex中体现得尤为明显，它能够承担从实现、重构到调试、测试及验证等一系列工程工作。早期测试表明，GPT‑5.5在实际工程工作所依赖的多项能力上表现更佳，例如在大型系统中保持上下文连贯性、在模糊的故障场景中进行推理、借助工具验证假设，以及在相关代码库中同步完成变更。

参与测试的高级工程师表示，GPT‑5.5在推理和自主性方面明显强于GPT‑5.4和Claude Opus 4.7，能够在不需明确提示的情况下提前发现问题，并预判测试与代码审查的需求。

“GPT-5.5比GPT-5.4明显更聪明、更持久，编码性能更强，工具使用也更可靠。它能够在不提前中断的情况下持续处理任务的时间显著更长。”Cursor联合创始人兼首席执行官Michael Truell表示。

不过，对于华尔街和开发者来说，最敏感的还是定价。

GPT-5.5的API价格并不美丽。输入每百万Token定价5美元，输出30美元，比GPT-5.4整体贵了一倍。若需要更强的Pro版本，价格更是高达输入30美元、输出180美元。

OpenAI的逻辑是，每个任务需要的Token更少，实际总成本可能不升反降。这一判断得到了英伟达方面的验证：在GB200 NVL72系统上运行的GPT-5.5，相比前代系统，每百万Token成本降至1/35，每兆瓦Token输出量提升50倍。

不过，这依然是一道不低的门槛。在AI Infra成本成为各家生死线的今天，抬高价格无疑会将一部分价格敏感、有复杂任务需求的中间开发者推向竞品的怀抱。

进军B端市场

理解了GPT-5.5的产品特性，也就不难理解OpenAI为何选择在这个时候，以这种形态发布这款模型。

时间倒回到2025年底至2026年初，OpenAI的日子并不好过。

一方面是内部战略的严重失焦。视频生成明星项目Sora上线半年即宣告关停，其高昂的算力成本（年化超55亿美元）与微薄的收入（约210万美元）形成了极致的反差。试图在文本、视频、浏览器、硬件等多条战线全面出击的OpenAI，陷入了“内部孵化器”式的混乱。

OpenAI应用业务CEO Fidji Simo在3月19日的内部备忘录中提到，公司过去在多个应用和技术栈上同时投入，导致开发速度放缓，部分产品的质量标准未能达到预期。她强调，当某些业务方向开始显现成效时，集中资源、避免分散是必要的选择。

另一方面是竞争对手的精准打击。尤其是在企业级市场，Anthropic凭借Claude Code等产品实现了惊人的增长，已将OpenAI逼到了墙角。Menlo Ventures的报告显示，Anthropic占据企业编码市场54%的份额，OpenAI 仅有21%；在企业级agent市场，Anthropic份额为40%，OpenAI为27%。

Ramp数据显示，在2026年3月新采购AI服务的企业中，高达65%选择了Anthropic，仅32%选择OpenAI。

更要命的是资本的压力。虽然OpenAI刚刚完成了1220亿美元的巨额融资，但这笔钱更像是“续命钱”。一份OpenAI内部报告文件指出，OpenAI预计2026年将亏损140亿美元，约为2025年早期预测的三倍。

为了实现最终上市并支撑8520亿美元的高估值，OpenAI必须向资本市场讲出一个比“聊天机器人第一”更具想象力的新故事。

而 GPT-5.5，就是这个故事的新脚本。

这个故事的剧本重写了主角。Fidji Simo在全员信中将战略优先级锚定在Codex，而非拥有9亿周活的ChatGPT。背后的逻辑是，C端流量的广告价值转化尚不明朗且充满争议，而B端企业为生产力工具的付费能力已经被证明了无数次。

因此，GPT-5.5的一切设计，从自主执行多步骤任务的能力，到对代码和科研场景的优化，无不是在为“智能体”铺路。OpenAI想要卖的，是一个可以替代初级员工、独立完成工作流的“数字打工人”。

值得注意的是，GPT-5.5的发布时机正好选在了Anthropic陷入“降智”争议的节骨眼上。OpenAI首席营收官Denise Dresser甚至在内部备忘录中直接点名炮轰对手的财务水分和不稳定性。亲自下场，也是为了在IPO前夕，向投资人证明自己的增长质量更高、生态更健康。

Denise Dresser还提及，多年期、多产品、上亿美元级别的企业交易正在快速增长，而当前最大的瓶颈是产能而非需求，因此Q2的首要任务之一就是加速招聘以支撑扩张。

OpenAI将筹码几乎全部压在B端和智能体上，意味着其要在Anthropic最擅长的领域与其正面交锋，这注定是一场硬仗。