起猛了家人们,OpenAI居然也学起了对手,搞起了“神秘”发布!
就在上周,关于Anthropic家 Claude Mythos 泄露的瓜大家都还没吃完,OpenAI 今天就坐不住了,直接甩出了全新模型 GPT-5.4-Cyber。重点是普通玩家根本摸不到实物,这玩意儿目前只有经过网络安全官方身份认证的专家才能调用。
安全能力拉满:不看源码也能盲抓Bug
为啥搞得这么神秘?因为这款基于GPT-5.4微调的针对性模型,在阶梯式能力测试中,已被官方评定为具备 “高”级别的网络安全能力。
对于苦逼熬夜搞代码审计的安全大佬来说,GPT-5.4-Cyber简直是梦中情机:它在合法研究环境中的拒绝响应率被大幅调低,减少了动不动就“抱歉,我是一个AI模型”这种扫兴情况。
最抓马的是,安全从业者现在甚至不需要获取软件源代码,就能直接对已编译的软件做逆向工程分析。揪出潜在的恶意软件倾向特征、评估系统架构的抗压鲁棒性,效率直接拉满。
“AI守门员”计划:代码刚写完安全就办妥
不仅仅是发布模型,OpenAI还围绕其生态升级了一整套名为 “信赖访问计划”(TAC) 的防御护城河。
这套计划的核心就是防患于未然,主打三大招数:
- 准入民主化:提供自动化身份认证,只要你是干干净净的“白帽子”,不管是个人大神还是小团队,都能借力最前沿的AI当保镖。
- 迭代式实战部署:闭门造车是练不出金钟罩的。OpenAI要把模型甩到小范围的真实攻防演练里,在被“越狱”和攻击的毒打中越锤越硬。
- 砸钱搞生态韧性:拿出高达1000万美元的安全资助,结合之前给开源社区送的Codex Security工具,给大家集体加防御Buff。
插播一条炸裂战绩:这套 Codex Security 工具目前已经做到了“盯防-报警-写修复代码”的自动化一条龙,目前已经成功修好了超过3000个高危甚至致命漏洞。真正实现了“代码刚敲完,漏洞就补好”。
硅谷巨头的安全焦虑症
其实,关于这款安全大杀器,几天前外媒 Axios 就已经爆出了独家猛料。
据说在上一代Codex上线后,OpenAI内部就已经悄咪咪安排上了TAC的内测,目标就是借用大模型极速推进防御性研究。但没想到,这波宣发竟然被死对头 Anthropic 抢先了一步。
就在上周,Anthropic 不仅大方公开了 Claude Mythos 的预览版全方位压倒性基准测试,还拉着苹果、谷歌、英伟达等40多家硅谷巨头,豪掷1亿美金成立了 “Project Glasswing”联盟,让顶级大厂提前把脉最强 AI。
面对对手的挑衅,OpenAI 隐忍了一周终于发牌,主打一个针锋相对——现在两家巨头的核心策略出奇一致:我们要把最强的 AI 能力,精准地交到经过验证的“守门员”手里。
【编辑观察】 目前的AI圈正处于一个非常微妙的博弈期。一份最新的安全报告指出,不用等大厂的巨无霸模型发威,市面上包括DeepSeek在内的一些开源小模型,甚至一个30亿参数(3B)的模型,都已经能发现部分旗舰级的零日漏洞(Zero-Day)。
巨头们现在可以说是进退两难:既怕自己打磨的“赛博利刃”伤了无辜招来监管的铁拳,又怕外面那些野生小模型先搞出大破坏。一场关于AI“攻击力”与“控制阈值”的生死时速,才刚刚拉开序幕,咱们这种普通吃瓜群众,接下来几年估计每天都会看得直呼刺激。


评论
暂无评论