OpenAI发布GPT-5.5:更贵的模型,更窄的战场
21世纪经济报道记者董静怡
4月24日凌晨,OpenAI发布了其最新一代大模型 GPT-5.5,距离上一次重大更新仅过去一个多月。
OpenAI团队认为,“这是我们迄今为止最智能、最直观易用的模型,也是迈向在计算机上完成工作的全新方式的重要一步。”
似乎是为了证明这款产品的颠覆性,OpenAI在介绍中引用了一位英伟达工程师的内测感受:“失去GPT-5.5,就像被截肢。”
上月,OpenAI宣布完成规模达1220亿美元的私募融资,估值高达8520亿美元,创下全球AI企业估值新纪录。但企业市场上,OpenAI的市场份额正被Anthropic以惊人的速度蚕食,随后OpenAI又忍痛砍掉了曾轰动世界的视频生成项目Sora,并进行了一场伤筋动骨的业务重组。
在2026年的这个时间节点,对于OpenAI来说挑战不小。看起来像是常规技术迭代的发布,底色更像一场自救。

更强、更快、也更贵
回顾生成式 AI 过去几年的发展历程,用户早已习惯了一个潜规则:每一次模型升级,几乎都伴随着不可忽视的“变慢”和“变贵”。更大的参数量、更长的思考时间,似乎是为“智能”支付的隐性代价。
但 GPT-5.5 的主打卖点,恰恰是打破了这条铁律。
OpenAI宣称,在真实的生产环境中,GPT-5.5 不仅智能水平大幅跃升,其每Token延迟与上一代GPT-5.4基本持平,甚至由于推理效率的优化,完成同样的复杂任务所需的Token数量反而更少。
在具体能力上,据介绍,GPT‑5.5 是OpenAI迄今为止最强的智能体编码模型。在测试复杂命令行工作流的Terminal-Bench 2.0上,它取得了82.7%的当前最优准确率。在评估真实GitHub问题解决能力的SWE-Bench Pro上,它的准确率达到58.6%,一次性端到端解决的任务数量超过了以往的模型。
其在编码方面的优势在Codex中体现得尤为明显,它能够承担从实现、重构到调试、测试及验证等一系列工程工作。早期测试表明,GPT‑5.5在实际工程工作所依赖的多项能力上表现更佳,例如在大型系统中保持上下文连贯性、在模糊的故障场景中进行推理、借助工具验证假设,以及在相关代码库中同步完成变更。
参与测试的高级工程师表示,GPT‑5.5在推理和自主性方面明显强于GPT‑5.4和Claude Opus 4.7,能够在不需明确提示的情况下提前发现问题,并预判测试与代码审查的需求。
“GPT-5.5比GPT-5.4明显更聪明、更持久,编码性能更强,工具使用也更可靠。它能够在不提前中断的情况下持续处理任务的时间显著更长。”Cursor联合创始人兼首席执行官Michael Truell表示。
不过,对于华尔街和开发者来说,最敏感的还是定价。
GPT-5.5的API价格并不美丽。输入每百万Token定价5美元,输出30美元,比GPT-5.4整体贵了一倍。若需要更强的Pro版本,价格更是高达输入30美元、输出180美元。
OpenAI的逻辑是,每个任务需要的Token更少,实际总成本可能不升反降。这一判断得到了英伟达方面的验证:在GB200 NVL72系统上运行的GPT-5.5,相比前代系统,每百万Token成本降至1/35,每兆瓦Token输出量提升50倍。
不过,这依然是一道不低的门槛。在AI Infra成本成为各家生死线的今天,抬高价格无疑会将一部分价格敏感、有复杂任务需求的中间开发者推向竞品的怀抱。
进军B端市场
理解了GPT-5.5的产品特性,也就不难理解OpenAI为何选择在这个时候,以这种形态发布这款模型。
时间倒回到2025年底至2026年初,OpenAI的日子并不好过。
一方面是内部战略的严重失焦。视频生成明星项目Sora上线半年即宣告关停,其高昂的算力成本(年化超55亿美元)与微薄的收入(约210万美元)形成了极致的反差。试图在文本、视频、浏览器、硬件等多条战线全面出击的OpenAI,陷入了“内部孵化器”式的混乱。
OpenAI应用业务CEO Fidji Simo在3月19日的内部备忘录中提到,公司过去在多个应用和技术栈上同时投入,导致开发速度放缓,部分产品的质量标准未能达到预期。她强调,当某些业务方向开始显现成效时,集中资源、避免分散是必要的选择。
另一方面是竞争对手的精准打击。尤其是在企业级市场,Anthropic凭借Claude Code等产品实现了惊人的增长,已将OpenAI逼到了墙角。Menlo Ventures的报告显示,Anthropic占据企业编码市场54%的份额,OpenAI 仅有21%;在企业级agent市场,Anthropic份额为40%,OpenAI为27%。
Ramp数据显示,在2026年3月新采购AI服务的企业中,高达65%选择了Anthropic,仅32%选择OpenAI。
更要命的是资本的压力。虽然OpenAI刚刚完成了1220亿美元的巨额融资,但这笔钱更像是“续命钱”。一份OpenAI内部报告文件指出,OpenAI预计2026年将亏损140亿美元,约为2025年早期预测的三倍。
为了实现最终上市并支撑8520亿美元的高估值,OpenAI必须向资本市场讲出一个比“聊天机器人第一”更具想象力的新故事。
而 GPT-5.5,就是这个故事的新脚本。
这个故事的剧本重写了主角。Fidji Simo在全员信中将战略优先级锚定在Codex,而非拥有9亿周活的ChatGPT。背后的逻辑是,C端流量的广告价值转化尚不明朗且充满争议,而B端企业为生产力工具的付费能力已经被证明了无数次。
因此,GPT-5.5的一切设计,从自主执行多步骤任务的能力,到对代码和科研场景的优化,无不是在为“智能体”铺路。OpenAI想要卖的,是一个可以替代初级员工、独立完成工作流的“数字打工人”。
值得注意的是,GPT-5.5的发布时机正好选在了Anthropic陷入“降智”争议的节骨眼上。OpenAI首席营收官Denise Dresser甚至在内部备忘录中直接点名炮轰对手的财务水分和不稳定性。亲自下场,也是为了在IPO前夕,向投资人证明自己的增长质量更高、生态更健康。
Denise Dresser还提及,多年期、多产品、上亿美元级别的企业交易正在快速增长,而当前最大的瓶颈是产能而非需求,因此Q2的首要任务之一就是加速招聘以支撑扩张。
OpenAI将筹码几乎全部压在B端和智能体上,意味着其要在Anthropic最擅长的领域与其正面交锋,这注定是一场硬仗。
