OpenAI反击！最强安全AI接管代码，3000个Bug灰飞烟灭

起猛了家人们，OpenAI居然也学起了对手，搞起了“神秘”发布！

就在上周，关于Anthropic家 Claude Mythos 泄露的瓜大家都还没吃完，OpenAI 今天就坐不住了，直接甩出了全新模型 GPT-5.4-Cyber。重点是普通玩家根本摸不到实物，这玩意儿目前只有经过网络安全官方身份认证的专家才能调用。

安全能力拉满：不看源码也能盲抓Bug

为啥搞得这么神秘？因为这款基于GPT-5.4微调的针对性模型，在阶梯式能力测试中，已被官方评定为具备 “高”级别的网络安全能力。

对于苦逼熬夜搞代码审计的安全大佬来说，GPT-5.4-Cyber简直是梦中情机：它在合法研究环境中的拒绝响应率被大幅调低，减少了动不动就“抱歉，我是一个AI模型”这种扫兴情况。

最抓马的是，安全从业者现在甚至不需要获取软件源代码，就能直接对已编译的软件做逆向工程分析。揪出潜在的恶意软件倾向特征、评估系统架构的抗压鲁棒性，效率直接拉满。

不仅仅是发布模型，OpenAI还围绕其生态升级了一整套名为 “信赖访问计划”（TAC） 的防御护城河。

这套计划的核心就是防患于未然，主打三大招数：

插播一条炸裂战绩：这套 Codex Security 工具目前已经做到了“盯防-报警-写修复代码”的自动化一条龙，目前已经成功修好了超过3000个高危甚至致命漏洞。真正实现了“代码刚敲完，漏洞就补好”。

其实，关于这款安全大杀器，几天前外媒 Axios 就已经爆出了独家猛料。

据说在上一代Codex上线后，OpenAI内部就已经悄咪咪安排上了TAC的内测，目标就是借用大模型极速推进防御性研究。但没想到，这波宣发竟然被死对头 Anthropic 抢先了一步。

就在上周，Anthropic 不仅大方公开了 Claude Mythos 的预览版全方位压倒性基准测试，还拉着苹果、谷歌、英伟达等40多家硅谷巨头，豪掷1亿美金成立了 “Project Glasswing”联盟，让顶级大厂提前把脉最强 AI。

面对对手的挑衅，OpenAI 隐忍了一周终于发牌，主打一个针锋相对——现在两家巨头的核心策略出奇一致：我们要把最强的 AI 能力，精准地交到经过验证的“守门员”手里。

【编辑观察】目前的AI圈正处于一个非常微妙的博弈期。一份最新的安全报告指出，不用等大厂的巨无霸模型发威，市面上包括DeepSeek在内的一些开源小模型，甚至一个30亿参数（3B）的模型，都已经能发现部分旗舰级的零日漏洞（Zero-Day）。

巨头们现在可以说是进退两难：既怕自己打磨的“赛博利刃”伤了无辜招来监管的铁拳，又怕外面那些野生小模型先搞出大破坏。一场关于AI“攻击力”与“控制阈值”的生死时速，才刚刚拉开序幕，咱们这种普通吃瓜群众，接下来几年估计每天都会看得直呼刺激。