冬至脚步近了,再忙也别忘了端上一盘热气腾腾的饺子。老话说“冬至不端饺子碗,冻掉耳朵没人管”,这暖意里还藏着好彩头。今年一定尝尝这3样吉祥馅:韭菜鸡蛋寓...
2025-12-19 0
智东西12月19日消息,今日凌晨,OpenAI发布最新编程模型GPT-5.2-Codex,该模型基于GPT-5.2,对智能体编程能力进行了深度优化,具体包括:提升了长程任务执行、大规模代码变更、兼容Windows环境以及网络安全防御等能力。OpenAI在博客中称这是他们迄今为止最强的编程模型。
据OpenAI官方博客,GPT‑5.2-Codex不仅继承了GPT‑5.2的优势,还融合了GPT‑5.1-Codex-Max的前沿智能体编程与终端操作能力,专为复杂的现实软件工程和网络安全等专业领域设计。
OpenAI已率先在Codex CLI、IDE扩展、云端以及代码审查中发布了GPT‑5.2-Codex,今日起已向所有付费ChatGPT用户开放,API访问也即将上线。
值得一提的是,GPT‑5.2-Codex发布之前,谷歌刚宣布推出Gemini 3 Flash模型。有网友让GPT‑5.2-Codex的Gemini 3 Flash共同执行任务,结果,GPT‑5.2-Codex败下阵来,在对50个文件进行漏洞审查的任务中,Gemini 3 Flash用时1分2秒,发现了5个问题,而GPT-5.2-Codex用时4分48秒,仅发现了2个Gemini 3 Flash已找到的问题。
GPT‑5.2-Codex的性能可能不及预期。有网友称,GPT‑5.2-Codex在SWE-Bench Pro上性能提升不到1%,还没有发布SWE-Bench Verified结果,这不免让人推测GPT‑5.2-Codex并未达当前最优水平,在一些系统卡基准测试中还出现了性能退步。
据OpenAI官方博客,从功能上看,GPT‑5.2-Codex新增了原生上下文压缩技术,在长上下文理解、工具调用、事实准确性以及原生的上下文压缩上表现提升,推理时Token使用效率提升,还能更精准地理解在编码过程中共享的截图、技术图表、数据图以及用户界面。在原生Windows环境中,GPT‑5.2-Codex对GPT‑5.1-Codex-Max的能力做了进一步的升级,智能体编程表现更加高效和可靠。
GPT‑5.2-Codex在实际软件工程任务中的表现有所提升,包括了代码库导航、重构、Pull Request的创建与审查等方面。
从基准测试来看,GPT‑5.2-Codex在评估修复真实世界代码问题的SWE-Bench Pro基准测试中得分为56.4%,超越GPT-5.2的55.6%得分以及GPT-5.1的50.8%得分;在衡量编译和服务器配置等任务的Terminal-Bench 2.0基准测试中,GPT‑5.2-Codex得分为64.0%,显著领先前代版本GPT‑5.1-Codex-Max的58.1%,展示出了模型在使用命令行和终端解决代理任务的进步。
据OpenAI官方博客,在网络安全领域,GPT‑5.2-Codex在夺旗挑战(CTF)中创下所有模型的最佳纪录。从折线轨迹来看,我们也能得出,就网络安全评估,OpenAI的模型能力正在持续提升。OpenAI博客称,他们正在全面升级网络安全防护,还引入可信访问机制来支持防御工作。
OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)称,上周,一位安全研究人员利用GPT‑5.1-Codex-Max发现并披露了React中的一个漏洞,该漏洞可能导致源代码泄漏。这反映出了模型能力应用于网络安全带来的实际价值。阿尔特曼还提到,这些模型还在不断改进中,最终会给网络安全带来益处。
GPT-5.2-Codex是OpenAI在编程模型上的又一次迭代,通过提升长程任务处理、大规模代码变更和特定环境表现,它为复杂开发与安全研究提供了更强大的支持,有望成为发现和修复漏洞的有力工具。
在OpenAI本次更新之前,谷歌同日也发布了低成本的Gemini 3 Flash模型,AI编程赛道竞争持续激烈。就目前来看,号称OpenAI最强编程模型的GPT-5.2-Codex在现实场景中的实际效能、与竞争对手产品的比较表现或许不及预期,该模型的实际应用效果和性能检验或将成为接下来的焦点。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:王欣逸,编辑:程茜,36氪经授权发布。
相关文章
冬至脚步近了,再忙也别忘了端上一盘热气腾腾的饺子。老话说“冬至不端饺子碗,冻掉耳朵没人管”,这暖意里还藏着好彩头。今年一定尝尝这3样吉祥馅:韭菜鸡蛋寓...
2025-12-19 0
大概十天前,莫斯科“俄罗斯在召唤”投资论坛上,普京面带胜利者的微笑,向全球媒体抛出一句豪言:“我们即将实现特别军事行动的所有目标。”尽管他没有细说,但...
2025-12-19 0
免责声明:图文源于网络,版权归原作者所有,若侵权请联系小编删除,文章内容不代表平台观点。随着寒潮渐起,“数九寒天”的话题,又热了起来。作为民间流传千年...
2025-12-19 1
智东西12月19日消息,今日凌晨,OpenAI发布最新编程模型GPT-5.2-Codex,该模型基于GPT-5.2,对智能体编程能力进行了深度优化,具...
2025-12-19 1
据澎湃新闻报道,12月16日,王毅外长的专机从约旦起飞返回国内,为期五天的中东之行画上句号。就在他登机前接受媒体采访时,特意点名日本现职领导人在台湾问...
2025-12-19 1
日本媒体《每日新潮》最近说,高市早苗之前关于台湾的发言让中日关系变得紧张,有人觉得两国关系可能会僵持十年。不过日本政府内部并不这么看,反而觉得明年11...
2025-12-19 0
发表评论