Agent 数据引擎

面向下一代 AI Agent 的数据基础设施。

我们构建 Benchmark、数据集与长时程环境，让前沿 Agent 能够在真实世界中学习、推理并行动。

Agent 数据范式的演进

从 Chatbot 到 Persistent Agent，AI 系统所需的数据基础设施正在发生根本性变化。

1Chatbot 时代

数据范式

Instruction Tuning 配对数据与 RLHF 偏好数据。由人工标注师策划的静态 (prompt, response) 样本。

2Single-Session Agent

数据范式

沙箱环境中的 Agent 轨迹数据。在单个有界会话内的 RL rollout、工具调用 trace 和奖励信号。

3Persistent Agent

数据范式

连续多天的交互数据流，涵盖不断变化的环境、持续累积的上下文，以及自我改进的 Agent 行为。

Evolvent 的聚焦方向

三个方向，同一使命：为 Agent 提供其进化所需的数据与环境。

Agent 数据引擎

针对 Computer Use、编程、研究和专业工作流 Agent 精细策划的高信号训练与评测数据。每一条样本都经过设计、验证、可追溯。

Proactive Agent

我们研究并训练 Proactive Agent——不等待指令，而是预判用户意图、感知上下文、主动采取行动的系统。

长时程 RL 环境

Desktop 虚拟机、MCP 服务器、端到端的专业工作流。用于训练和评测跨越数百步骤、长达数小时的真实任务。

来自数据引擎的生产级数据集与工具

结构化的任务分解数据，用于训练具备多 Agent 协调能力的 Planner 模型。

面向 Coworker Agent 的基准测试 — 涵盖 13 个专业领域的 100 个任务，支持多日交互、实时环境变化与多模态输入。

评估编码 Agent 权限边界感知能力的基准测试 — 涵盖 10 个专业领域的 120 个任务，测试模型能否为终端任务生成合理的文件级权限策略。

加入正在与 Evolvent AI 合作的领先 AI 团队——Agent 数据、Benchmark 和长时程环境。预约 1:1 demo 开始合作。