GinoGino

OpenAI 全新智能体平台 [译]

6 分钟阅读人工智能

尽管现在业界普遍认为 2025 年将是「智能体之年」,OpenAI 却在默默发力,为此目标积极布局。今年年初的两个月,他们相继推出了 OperatorDeep Research,堪称目前为止最成功的智能体之一。而今天,他们正在将这些能力中的诸多部分开放到 API 接口。

我们将在今天的 YouTube 闪电播客中介绍所有这些内容以及更多精彩信息!

下面是细节部分。

Responses API(响应 API)

Responses API

在我们的 Michelle Pokrass 那期节目 中,我们讨论过 Assistants API(助手 API)需要重新设计。今天,OpenAI 推出了 Responses API,这是一个更灵活的基础,供开发者构建智能体应用。它不仅是 Chat Completion API 的超集,更是开发者探索 OpenAI 模型的理想起点。

其中一个重要的升级是为响应 API 提供了一套新的内置工具:网页搜索、计算机使用和文件搜索。

Web Search Tool(网页搜索工具)

之前我们曾在播客中邀请了 Exa AI 来讨论 AI 的网页搜索。现在 OpenAI 也加入了这场网页搜索的竞争;Web Search API(网页搜索 API)实际上是一个新的"模型",它公开了两个 4o 微调模型:gpt-4o-search-previewgpt-4o-mini-search-preview。这些模型与 ChatGPT Search 使用的模型相同,价格分别为每 1000 次查询 30 美元和 25 美元。

其强大的功能是内联引用:你不仅可以获得指向相关页面的链接,更能直接定位到结果页面中精准解答你疑问的具体位置。

Web Search Tool

Computer Use Tool(计算机使用工具)

驱动 Operator 的模型名为 Computer-Using-Agent (CUA,计算机使用智能体),现在也可在 API 中使用。computer-use-preview 模型在大多数基准测试中都处于领先地位,在 OSWorld 上实现了 38.1% 的完整计算机使用任务成功率,在 WebArena 上实现了 58.1% 的成功率,在 WebVoyager 上实现了 87% 的基于 Web 的交互成功率。

正如文档所示,computer-use-preview 不仅是一个模型,还是一个允许你自定义运行环境的强大工具。

Computer Use Tool

使用价格为每 100 万个输入 tokens 3 美元,每 100 万个输出 tokens 12 美元,目前仅对第 3-5 层的用户开放。

File Search Tool(文件搜索工具)

文件搜索也可在 Assistants API(助手 API)中使用,现在也已加入 Responses API。OpenAI 正在将搜索和 RAG(检索增强生成)技术集成到一个统一的平台中,我们肯定会看到更多人尝试在 OpenAI 上找到构建一体化应用的新方法。

使用价格为每千次查询 2.50 美元,文件存储价格为每天每 GB 0.10 美元,首 GB 免费。

File Search Tool

Agent SDK(智能体 SDK):Swarms++!

https://github.com/openai/openai-agents-python

Agent SDK

为了实现更强大的整合,在 Swarm 广受欢迎之后,OpenAI 正式发布官方支持的智能体框架,该框架在 我们的 AI Engineer Summit 上进行了预览,包含4 个核心部分:

  • 智能体(Agents):可轻松配置的 LLM,具备明确的指令和内置工具。
  • 移交(Handoffs):智能地实现智能体之间的控制权转移。
  • 安全护栏(Guardrails):可配置的安全检查机制,用于输入和输出的有效性验证。
  • 追踪与可观测性(Tracing & Observability):将智能体执行的轨迹可视化呈现,用于调试和性能优化。

多智能体工作流程将长期存在!

Example

为了实现更完善的智能体应用,OpenAI 目前正在设计一系列 常见的智能体应用模式 ,这些模式包括:工作流、移交、智能体即工具、大语言模型即裁判、并行化和安全护栏。OpenAI 在纽约演讲的第二部分中透露了这一点:

当然,也可以在观看以下发布会的直播内容:

原文链接:⚡️ The new OpenAI Agents Platform