AI Agent 生态速报 | 2026-05-23:所有模型实验室都在变 Agent 实验室

AI Agent 生态速报 | 2026-05-23:所有模型实验室都在变 Agent 实验室

Greg Brockman 宣称「模型本身不再是产品」;Anthropic 以 3 亿美元收购 Stainless 并关闭 SDK 生成服务,OpenAI/Google/Cloudflare 失去共享工具链;MCP 协议发布无状态 RC;OpenClaw 突破 30 万 stars 与 Gemini Spark 形成个人 Agent 托管 vs 自托管分裂;MOSS 自进化 Agent 与 Agentic Workflow 编译研究同步落地。

Agent 生态周报
2026. 5. 24. · 10:04
구독 1개 · 콘텐츠 33개

리서치 브리프

Greg Brockman 5 月 23 日说了一句话,像是给最近几个月的行业动作盖了章:「模型本身不再是产品」1。同一天,Anthropic 以 3 亿美元收购了为 OpenAI、Google、Cloudflare 同时生成 SDK 的 Stainless,并宣布关闭共享 SDK 生成服务2。这两件事放在一起,比任何一件单独来看都更能说明现在的竞争逻辑:模型差距在收窄,工具链控制权成了新的护城河。

「模型不再是产品」:行业级认知转变

AINews 5 月 23 日的每日报告标题直接就叫「All Model Labs are now Agent Labs」1。支撑这个判断的信号同一天集中出现:
  • OpenAI:Greg Brockman 说「模型本身不再是产品」,是其一系列强调 Agent/Harness 组合评论中最直接的一次;同日 Codex Thursday No.6 上线,带来 Appshots(截屏即可操作,无需手动粘贴代码)、/goal 改进、锁屏状态下的远程电脑控制、标注模式和插件分享
  • AI21:关闭模型团队,转向 Agent 产品线——这是早期模型实验室中少见的明确转向公告
  • DeepSeek:官方宣布 V4-Pro 75% 折扣永久化,定价降至约 $0.18/M blended,比 Gemini 3.1 Pro Preview 便宜约 3 倍、比 GPT-5.5 便宜约 12 倍1。模型成本压到这个量级之后,Agent 层的编排和工具链价值才有机会超过底层推理成本
这背后的逻辑 AINews 描述得很精准:当模型「与 harness 协同训练」,提供商就有动力把访问路径收拢到自己的 Agent 产品,而不是开放给所有上层构建者。这对独立框架开发者(LangChain/AutoGen/CrewAI 等)是一个长期信号,需要警惕。

Anthropic 收购 Stainless:开发者工具链争夺进入新阶段

링크 미리보기를 불러오는 중…
Stainless 做的事情乍看朴素:给一份 OpenAPI 规范,自动生成 TypeScript、Python、Go、Java 等多语言 SDK,并保持随 API 变更自动更新2。它估计覆盖了全球约 1/4 专业开发者用过的 SDK,客户包括 OpenAI、Google、Cloudflare、Replicate、Runway。
收购后,Stainless 宣布关闭所有托管产品。现有客户保留已生成的 SDK 版权,但 SDK 生成服务不再对外提供——包括后续随 API 变更自动更新的能力。被影响最大的是竞争对手:
被影响方问题
OpenAI / Google / Cloudflare失去共享 SDK 生成器,需要重建或转用其他工具
独立 MCP 服务器生成方Stainless 同时生成 MCP 服务器,也一并停用
中小型 AI API 公司同等规模重建内部 SDK 工具链成本偏高
这是 Anthropic 第三次类似收购:2025 年 12 月买了 JavaScript 运行时 Bun,OpenAI 2026 年 3 月买了 Python 工具链 Astral(uv/Ruff),现在 Anthropic 再买 SDK 层2。这三次收购的共同逻辑:运行时、包管理器、SDK 生成器是开发者工作流的每日接触层,一旦内化,迁移成本就以微小但持续的方式累积。Bun 和 Astral 保持了开源,Stainless 则选择关闭托管服务——这是程度上的差别,也可能是后续讨论的焦点。

MCP 2026-07-28 RC:协议无状态化,影响运维架构

MCP 最新 Release Candidate(预计 7 月 28 日正式发布)带来了一项根本性变化:协议无状态化3
核心改动:
  • 移除 Mcp-Session-Id 头——协议层不再有会话概念,需要状态的工具通过请求 payload 传递显式状态句柄
  • 移除初始化握手流程——协议版本、客户端能力随每个请求的 _meta 块传输,新增 MCP-Protocol-Version 必填请求头
  • 移除可恢复 SSE 流——长时任务迁移至新的 MCP Tasks 扩展
同时新增两个一级原语:
  • MCP Apps:服务端通过 ui:// URI 提供 UI 模板,客户端在沙箱 iframe 渲染,无需额外集成即可在 Agent/Human-in-the-loop 界面展示交互表单
  • MCP Tasks:长时异步任务状态机;任务 ID 具备不记名令牌语义,任务生命周期可超出单次连接
对团队的实际影响:无状态化让横向扩展更简单(不需要粘性会话),但也意味着现有依赖会话保持的 MCP 服务需要改造状态管理方式。已经在生产部署 MCP 服务器的团队建议提前评估迁移工作量。

OpenClaw 30 万 stars vs Gemini Spark:个人 Agent 层的分裂

링크 미리보기를 불러오는 중…
OpenClaw 在 4 月突破 30 万 GitHub stars,成为 GitHub 增速最快的仓库之一。它的核心卖点:在你自己的设备(比如 Mac mini)上运行,凭证在你手里4
5 月 20 日 Google I/O 发布的 Gemini Spark 做的是完全相反的赌注:跑在 Google Cloud 的虚拟机上,你不知道机器在哪里,但它已经连通了 Gmail、Docs、Sheets,无需手动配置4
TNS 对此有一个判断值得参考:「Dropbox 打败了家用 NAS,Gmail 打败了自建邮件服务器。托管方案对大多数用户来说几乎总是赢的,因为大多数人愿意用控制权换取不用思考。」但这里的关键不同点在于:把文件交给 Dropbox 和把有权读写你的 Gmail、Docs、日历的 Agent 交给 Google,是两类完全不同的数据信任关系4
对开发者的判断:自托管路线不会消失,它会形成一个规模较小但粘性更强的细分——关注凭证控制权的企业和开发者。两条路在 MCP 工具连接层正在趋同,但底层基础设施的归属在此之后将是持久的分歧。

研究前沿:自进化 Agent 与 Agent 编译

Requesty 汇总了 5/19–5/23 一周最值得关注的五项技术进展,其中两项对产品设计影响最直接5
링크 미리보기를 불러오는 중…
MOSS(自进化 Agent):Agent 识别自身逻辑的弱点,对特定模块的 Python/TypeScript 源代码进行改写,通过自动化测试后部署改进版本。这不是 prompt 调整,而是字面意义上修改源文件。配套的 Ratchet 框架提供非散度分析,防止 Agent 把自己改坏。实际意义:把「人工审查日志 → 手动更新 → 推送」这个循环变为自动化——提升速度,也带来新的审计需求。
Agentic Workflow 编译进模型权重:把多步 Agent 流水线(规划→研究→写作→审查)提炼成单次前向推断,成本降低约 100 倍、延迟从 30 秒降到 2 秒,且质量接近前沿水平。逻辑是:一旦 Agent 工作流稳定下来,就可以把它「编译」成更轻量的模型,处理 80% 常规请求,边缘情况仍走完整 Agent 管线。这是一个对 Agent 成本经济学冲击较大的方向,值得在工程规划中纳入考量5

安全:Anthropic Project Glasswing,一个月 1 万+ 漏洞

Anthropic 披露了 Project Glasswing 的初步结果:与合作伙伴一起,在一个月内在关键软件中找到超过 1 万个高危或严重漏洞,并明确警告行业需要为 Claude Mythos Preview 这类模型能产出的漏洞数量做好准备1。Perplexity 同日开源了 Bumblebee,一个 macOS/Linux 只读扫描工具,用于检测高风险包、扩展和 AI 工具配置。
这两件事放在一起的含义:AI 发现漏洞的速度已经远超人工修复速度,安全工程的规模和节奏都需要跟着 Agent 能力重新校准。

今日几个值得持续跟踪的点
  • Anthropic Stainless 收购关闭 SDK 服务后,OpenAI 和 Google 会如何调整 SDK 维护策略
  • MCP 2026-07-28 RC 的无状态化对现有框架(LangChain/LangGraph 等)的适配进度
  • Codex Appshots 功能在实际编码工作流中的用户反馈,相比 Claude Code 和 Cursor 的差异点

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.