AI 打败 AI：谷歌利用 GPT-4 击败 AI-Guardian 审核系统-SpringForAll社区

8 月 2 日，据外媒报道，谷歌研究团队正在进行一项实验，他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施，该团队目前已经攻破 AI-Guardian 审核系统，并分享了相关技术细节。

AI-Guardian 是一种 AI 审核系统，能够检测图片中是否存在不当内容，及图片本身是否被其他 AI 修改过，若检测到图片存在上述迹象，便会提示管理员前来处理。

据悉，GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian，论文中提到，GPT-4 可以让 AI-Guardian 认为「某人拿着枪的照片」是「某人拿着无害苹果的照片」，从而让 AI-Guardian 直接放行相关图片输入源。谷歌研究团队表示，通过 GPT-4 的帮助，他们成功地「破解」了 AI-Guardian 的防御，使该模型的精确值从 98% 的降低到仅 8%。（来源：IT 之家）

THE END

行业消息

AI 打败 AI：谷歌利用 GPT-4 击败 AI-Guardian 审核系统

请登录后发表评论

第33期：《Java面试八股文》｜已结束

第61期：《搞定系统设计：面试敲开大厂的门》

Spring Security 5.7.0-M2 发布

Spring Security 架构

第24期：《GitLab CI/CD 从入门到实战》｜已送完

第93期：《深入Flowable流程引擎：核心原理与高阶实战》

第50期：《AIGC自动化编程》

第64期：《架构思维：从程序员到CTO》

第23期：《Spring Boot 3核心技术与最佳实践》（已送完）

第25期：《Java核心技术》卷2｜已结束

Spring Modulith 2.0 M2, 1.4.3, and 1.3.9 released

Spring Boot 4.0.0-M2 available now

Spring Boot 3.5.5 available now

Spring Boot 3.4.9 available now

Spring Batch 6.0.0-M2 available now

Spring Authorization Server 2.0.0-M2, 1.5.2 and 1.4.5 available now

Spring for Apache Pulsar 1.2.9 and 2.0.0-M2 are now available

Spring Security 7.0.0-M2 available now

Spring Security 6.4.9 and 6.5.3 Released

Spring Data 2025.1.0-M5 released

波士顿动力发布了新的全电动Atlas机器人预告片

盘点 Redis 的可选替代品

12分钟理解 React 中的所有 Hook

OpenAI和微软宣布Stargate项目，耗资1000亿美元构建AI超级计算机

Linux 受到后门攻击而遭受破坏

华为手机壳卖1999元、马斯克称工会要求加薪40%…

台积电AI芯片将涨价

96岁李嘉诚大动作，涉及AI

19 分钟充满电！小米 13T 系列海外首发：首次支持 IP68

B 站公布 68 部国创动画作品，包括《中国奇谭第二季》