首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

扫地机:2025年618电商节首阶段,线上零售额增长11.8%,成交量增长18.8%,均价下滑5.9% 美妆行业跨境电商站解决方案:数商云赋能品牌全球化增长 概念炒作+京东增持暴涨70%,德邦股份关联交易依赖与业绩隐忧浮现 京东科技与农夫铺子合作签约,4大领域助力产业数智升级 京东科技50亿元商票ABS项目更新至“已反馈” 艾美特空气循环扇X133天猫优惠价122元 618什么时候最便宜?2025淘宝京东6月17日晚8点最划算省钱优惠力度最大 机器人之后,荣耀不止于智能手机制造 神牛V350s索尼版热靴闪光灯天猫优惠价579元 轻量化全媒体AI拍摄直播一体机 索尼Z200成都28500元 运动相机推荐: 影石Insta360 Ace Pro2 与 Ace Pro,解锁户外精彩瞬 小米YU7三款车型电池品牌公开,弗迪和宁德时代为供应商 小米16首发!曝高通骁龙8 Elite 2飙至4.8GHz:频率前所未有 离谱!小米YU7还未上市 老头乐版已交付:车标是“M七” 小米辣920:直播界的“正能量偶像”,用坚持和热爱成就梦想 华为 Pura 80 系列预约人数接近 20 万 华为Pura 80系列今日开启预约!外观首次亮相:超大三角镜头模组 华为Pura80系列今日开启预约,6月11日发布 OPPO 产品总监评华为 Pura 80 相机模组:非常贵,应该打破目前长焦单一模组成本记录 三星Galaxy S25手机12GB+256GB暮河银1890元 华硕ROG XG27UCS电竞显示器限时特惠1529元 联想Lenovo异能者鼠标垫限时优惠价12.9元 小红书开放跳转京东,此前已开放跳转淘天,小红书彻底放开站外电商广告 云南出台12项举措力促高校毕业生电商创业 海关精准护航 跨境电商跑出“加速度” 【强信心 看发展·招商引资拼落地】京东物流JDL天水运营中心:激活陇东南区域经济新引擎 京东家政启动“百县十万人招募计划” 创造更多高质量就业机会 碧云泉H7厨下净水器天猫活动价低至7999元 宏碁暗影骑士擎7 2025游戏本天猫超值优惠 广汽传祺“向往S7智趣家庭露营节”圆满举行 扫码阅读手机版