Agent 不只会写代码了：安全修复、跨语言协作和长期任务都在补关键环节

今日主线：最近 24-36 小时的新动态都指向同一件事：Agent 正在从“能生成代码”进入“能被组织使用”的阶段。安全修复要有人类复核和披露流程，跨语言 Agent 要有协议边界，长期任务要有持续上下文，平台还要让成本和调试信息可见。

今日重点

OpenAI 扩展 Daybreak 与 Patch the Planet：AI 安全能力开始从“发现漏洞”推进到“验证、修复、测试、披露”的完整闭环。
GitHub Copilot JetBrains 更新：组织级 Agent、Claude Agent Provider、每轮 AI Credits 指标和 Cloud Agent GA，继续把 Agent 拉进企业治理。
Google 用 ADK + A2A 演示跨语言多 Agent：Python Agent 与 Go Agent 通过开放协议协作，Agent 系统越来越像分布式工程。
Jules 团队提出主动型 Coding Agent 评估：未来不只评估“能不能修 bug”，还要评估 Agent 是否知道什么时候该提醒、该沉默、该继续探索。
Cloudflare R2 SQL 增强分析能力：对象存储上的 serverless SQL 继续补齐窗口函数、集合运算和聚合能力，数据基础设施更贴近开发者日常分析。

行业

OpenAI 扩展 Daybreak，AI 安全从发现漏洞走向修复闭环

OpenAI 6 月 22 日宣布扩展 Daybreak，推出更新后的 Codex Security 插件、面向可信防御者的 GPT-5.5-Cyber 完整版本，以及 Daybreak Cyber Partner Program。OpenAI 称，Codex Security 云端研究预览已扫描 3 万多个代码库、3000 多万次提交，并有大量发现被人工或自动标记为已修复。

这条消息的重点不只是“模型更会找漏洞”。真正值得开发者关注的是安全工作流被重排：模型负责在大代码库里发现线索、生成验证证据和补丁建议，人类安全工程师负责确认、定级、披露和合并。AI 安全能力越强，越不能只追求更多告警，反而要把误报过滤、可复现证据、补丁测试和审计链路做得更扎实。

来源：https://openai.com/index/daybreak-securing-the-world/

三星大规模部署 ChatGPT 与 Codex，企业 AI 采用继续从试点走向平台化

OpenAI 6 月 21 日宣布，Samsung Electronics 将向韩国全体员工，以及全球 Device eXperience 业务员工开放 ChatGPT Enterprise 和 Codex。OpenAI 称这是其迄今最大规模企业部署之一，覆盖研发、制造、营销、产品开发、企业职能等场景；同时披露 Codex 每周活跃用户已超过 500 万。

这类案例对企业开发团队的启发是：Codex 这类工具已经不再只被包装成“开发者写代码助手”，而是开始进入内部工具、自动化流程、文档、数据分析和业务原型制作。真正的难点会从“买不买工具”变成“怎么做权限、数据边界、使用度量、代码审查和内部流程接入”。

来源：https://openai.com/index/samsung-electronics-chatgpt-codex-deployment/

产品

GitHub Copilot JetBrains 更新：组织级 Agent、Claude Provider 和每轮成本提示一起上

GitHub 6 月 22 日发布 Copilot for JetBrains IDEs 更新：支持在 JetBrains 中使用 GitHub 组织和企业级自定义 Agent；Copilot CLI 会话支持在请求运行中追加、引导或停止并发送新消息；Agent Debug 面板新增日志汇总视图；Claude 作为 Agent Provider 进入 public preview；Cloud Agent 也已 GA。

这次更新很像一组“企业化补丁”。组织级 Agent 让管理员分发标准化工作流，日志汇总让会话更容易排查，每轮 AI Credits 指标让成本从月底账单提前进入开发过程。值得注意的是，Claude Agent 当前以 bypass permissions mode 运行，文件编辑和工具调用会自动批准，团队试用时要格外注意权限边界。

来源：https://github.blog/changelog/2026-06-22-new-features-and-claude-as-agent-provider-preview-in-jetbrains-ides/

OpenAI 发布 Codex 长期任务实践，Agent 工作流开始强调持续上下文

OpenAI 6 月 22 日发布《Codex-maxxing for long-running work》，将 Codex 描述为一个可以保留上下文、管理复杂工作流、支撑长期项目推进的持久工作空间。文章强调把大目标拆成可验证步骤、在多个工作流之间保持连续性，并判断什么时候交给 Codex 执行、什么时候需要人类监督。

这其实戳中了很多团队用 Agent 的真实痛点：一次 prompt 做完一个小任务不难，难的是跨越几天、几十个文件、多个分支和反复审查后，Agent 还能理解现在走到哪一步。长期任务能力不只是上下文窗口变大，还包括任务拆解、状态记录、验证点、回滚和人类接管。

来源：https://openai.com/index/codex-maxxing-long-running-work/

Cloudflare R2 SQL 支持窗口函数和集合运算，对象存储分析继续靠近数据库体验

Cloudflare 6 月 22 日更新 R2 SQL，新增窗口函数、SELECT DISTINCT、UNION / INTERSECT / EXCEPT、GROUPING SETS / ROLLUP / CUBE，以及 MEDIAN、PERCENTILE_CONT、ARRAY_AGG、STRING_AGG 等聚合能力。R2 SQL 是 Cloudflare 用于查询 R2 Data Catalog 中 Apache Iceberg 表的 serverless SQL 引擎。

这条不是 AI 热点，但对开发者基础设施很实际。越来越多日志、事件、特征和分析数据会先落到对象存储，如果查询层能直接支持更接近数据仓库的 SQL，就可以少做一层预处理或搬运。对边缘应用、Agent 运行日志、用量分析和数据产品来说，这类能力会降低把冷数据转成可分析数据的门槛。

来源：https://developers.cloudflare.com/changelog/#2026-06-22

模型

Google 用 ADK + A2A 演示跨语言多 Agent，单体大 Prompt 正在被拆开

Google Developers Blog 6 月 22 日发布示例，用 Agent Development Kit 和 Agent2Agent 协议构建一个合同合规流水线：Python Agent 负责用 Gemini 抽取合同字段，Go Agent 负责用确定性逻辑做合规校验，两个服务通过 A2A 协议协作。文章强调 Agent Card、JSON-RPC、任务生命周期和远程 Agent 封装。

这条值得关注，因为它把 Agent 工程从“一个大模型带一堆工具”推向更清晰的服务边界。LLM 适合处理模糊抽取和推理，Go/Rust/Java 服务适合执行确定性策略和审计逻辑。未来多 Agent 系统很可能不是所有东西都塞进同一个上下文，而是像微服务一样按责任、语言、权限和可测试性拆开。

来源：https://developers.googleblog.com/build-cross-language-multi-agent-team-with-google-agent-development-kit-and-a2a/

Jules 团队讨论主动型 Coding Agent 评估：不只看任务完成，还要看洞察是否有价值

Google 6 月 22 日发布 Jules 相关研究介绍，提出主动型 Coding Agent 需要评估 insight policy，也就是 Agent 什么时候应该提醒、提问、起草、继续观察或保持沉默。团队用 705 个真实 bug、1178 个代码变更构建初步评估，把相关 bug 聚类成更高层目标，再让 Agent 在有限探索轮次内生成诊断洞察。

这比传统 SWE-Bench 式“修一个明确 bug”更接近真实开发。很多时候开发者不是缺一个补丁，而是缺“现在代码库里有哪些风险正在汇合”的判断。对团队来说，未来评估 Coding Agent 不能只看通过率，还要看它是否会在正确时间给出高信号洞察，避免把开发者淹没在低质量提醒里。

来源：https://developers.googleblog.com/measuring-what-matters-with-jules/

开源

Patch the Planet 面向关键开源项目，维护者负担成为 AI 安全落地核心问题

OpenAI 同日推出 Patch the Planet，由 Daybreak 与 Trail of Bits 合作，联合 HackerOne、Calif、研究者和维护者，帮助关键开源项目从漏洞发现走到补丁落地。初始参与项目包括 cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go、freenginx、Python 和 python.org 等。

这条对开源生态很关键。AI 会让漏洞发现速度变快，但维护者不应该被更多未经验证的报告压垮。Patch the Planet 的设计重点是由安全工程师先复现、去重、定级、开发补丁和协调披露，再交给维护者决策。未来 AI 安全工具能否被开源社区接受，很大程度取决于它是减轻维护者负担，还是制造更多噪音。

来源：https://openai.com/index/patch-the-planet/

讨论

Agent 的下一道门槛：从“更自治”转向“更可控”

把今天这些新消息放在一起，会看到 Agent 生态正在补三类基础能力：一是安全闭环，不能只发现问题，还要能验证和修复；二是组织治理，Agent 要被管理员分发、审计、计费和调试；三是系统边界，多 Agent 需要协议、状态、失败转人工和确定性服务。

这也是开发者选型时要看的重点：Agent 是否能接入现有工程流程？成本是否能按会话和用户被看见？权限是否默认最小化？日志是否足够复盘？补丁是否有测试和证据？越是“自动化程度高”的工具，越需要这些工程护栏。

来源：https://openai.com/index/daybreak-securing-the-world/
来源：https://github.blog/changelog/2026-06-22-new-features-and-claude-as-agent-provider-preview-in-jetbrains-ides/
来源：https://developers.googleblog.com/build-cross-language-multi-agent-team-with-google-agent-development-kit-and-a2a/

菜单

分享

Agent 不只会写代码了：安全修复、跨语言协作和长期任务都在补关键环节

今日重点

行业

OpenAI 扩展 Daybreak，AI 安全从发现漏洞走向修复闭环

三星大规模部署 ChatGPT 与 Codex，企业 AI 采用继续从试点走向平台化

产品

GitHub Copilot JetBrains 更新：组织级 Agent、Claude Provider 和每轮成本提示一起上

OpenAI 发布 Codex 长期任务实践，Agent 工作流开始强调持续上下文

Cloudflare R2 SQL 支持窗口函数和集合运算，对象存储分析继续靠近数据库体验

模型

Google 用 ADK + A2A 演示跨语言多 Agent，单体大 Prompt 正在被拆开

Jules 团队讨论主动型 Coding Agent 评估：不只看任务完成，还要看洞察是否有价值

开源

Patch the Planet 面向关键开源项目，维护者负担成为 AI 安全落地核心问题

讨论

Agent 的下一道门槛：从“更自治”转向“更可控”

评论

12个免费虚拟手机号平台：注册免烦恼，一键即可接码！

2025年最新国外接码平台推荐（免费+付费）

让你的 Cursor 变得和 JetBrains IDEs 一样好用

Spring Cloud 2025.1 (Oakwood) 正式发布：做减法，轻量化

AI智能体（AI Agent）最常用框架总结

Spring AI 参数配置详解，效果提升立竿见影

微服务正在悄然消亡：这是一件美好的事

代码量减半！SpringBoot 4.0 的 BeanRegistrar 到底有多香？

三个 Cursor 实用 MCP 推荐

Java 25 vs Scala: 为什么 Scala 领先了 20 年