OpenAI 更新《准备框架》：聚焦识别和缓解具体风险、细化能力分类，更好应对 AI 安全挑战

作者：方泰攻略站时间：2025-04-18 16:34:53

本站 4 月 16 日消息，OpenAI 公司今天（4 月 16 日）发布博文，宣布为更好追踪和应对前沿 AI 能力可能带来的严重危害风险，发布新版《准备框架》（Preparedness Framework）。

本站注：《准备框架》是 OpenAI 在开发和部署环节，用于评估 AI 模型安全性的内部系统。

新框架通过更聚焦的方式，识别并缓解具体风险，同时强化风险最小化的要求，为组织如何评估、治理和披露安全措施提供明确指引。OpenAI 还承诺，随着技术进步，将投入更多资源，确保准备工作更具行动力、严谨性和透明度。

新框架为高风险能力设定了清晰的优先级标准，通过结构化的风险评估流程，判断某项前沿能力是否可能导致严重危害。每项能力根据定义标准被归类，并追踪符合五项关键标准的能力。

此外，框架引入了更细化的能力分类，包括追踪类别（Tracked Categories）、网络安全能力（Cybersecurity capabilities）和 AI 自我改进能力（AI Self-improvement capabilities）等。

OpenAI 认为，这些领域将带来 AI 在科学、工程和研究中最具变革性的益处。同时，新增的研究类别（Research Categories）涵盖可能造成严重危害但尚未达到追踪标准的领域，如长距离自主性（Long-range Autonomy）、故意低表现（Sandbagging）和自主复制与适应（Autonomous Replication and Adaptation）等。

框架进一步明确了能力等级，简化为“高能力”（High capability）和“关键能力”（Critical capability）两个门槛。无论哪一等级，在开发和部署前均需采取足够的安全措施，以降低严重危害风险。

OpenAI 内部的安全顾问小组（Safety Advisory Group）负责审查这些措施，并向领导层提出建议。此外，框架引入了可扩展的评估机制，支持更频繁的测试，并通过详细的 Safeguards Reports 报告安全措施的设计强度和验证效果。若其他 AI 开发者发布缺乏同等安全措施的高风险系统，OpenAI 可能调整自身要求，但会先确认风险形势变化，公开承认调整，确保不增加整体风险。

OpenAI 更新《准备框架》：聚焦识别和缓解具体风险、细化能力分类，更好应对 AI 安全挑战
本站 4 月 16 日消息，OpenAI 公司今天（4 月 16 日）发布博文，宣布为更好追踪和应对前沿 AI 能力可能带来的严重危害风险，发布新版《准备框架》（Preparedness Framew

阅读详情
联想拯救者 Y700 平板四代亮相：8.8 英寸黄金握持手感、骁龙全新处理器
本站 4 月 17 日消息，联想官方今日发布了新品预告，其中拯救者 Y700 平板四代首发亮相。新机预计将延续家族式设计风格，采用直边 + 直屏设计方案。据介绍，联想拯救者 Y700 平板四代搭载骁龙

阅读详情
业界首个，阿里通义万相“首尾帧生视频模型”开源
本站 4 月 17 日消息，阿里通义万相「首尾帧生视频模型」今日宣布开源，该模型参数量为 14B，号称是业界首个百亿参数规模的开源首尾帧视频模型。它可根据用户指定的开始和结束图片，生成一段能衔接首尾画

阅读详情
天猫魔屏 C3 投影仪发布：1080P、优酷内容终身会员，1599 元
本站 4 月 17 日消息，天猫魔屏 C3 投影仪今日上市，售价 1599 元。该投影仪主打优酷内容终身会员，支持 1080P 画质，配有 2GB + 32GB 存储、双 5W 喇叭。天猫魔屏 C3

阅读详情
V 社 Steambox 迷你主机原型机硬件流出：锐龙 5 1400 + RX 580、支持连接 eGPU 外置显卡
本站 4 月 18 日消息，V社在 2015 年联合几家计算机厂商推出了多款 Steam Machine电竞主机，系列电竞主机具体配置不一，主要共性是运行SteamOS Windows双系统，旨在

阅读详情
大国重器刷新纪录：中国出口海外最大直径盾构机在河南郑州下线
本站 4 月 16 日消息，据河南发布消息，我国自主研制的超大直径盾构机“中铁 1459 号”今日在位于郑州经开区的中铁装备国家 TBM 产业化中心顺利下线。中铁装备集团党委书记、董事长林军科介绍，该

阅读详情

OpenAI 更新《准备框架》：聚焦识别和缓解具体风险、细化能力分类，更好应对 AI 安全挑战

相关文章

热门影评