自定义Agent开发框架——三步创建一个Agent

一、Agent 开发框架概览：从 Prompt 工程到 Agent 工程

Prompt 工程解决的是"如何让大模型给出正确答案"，而 Agent 工程解决的是 "如何让大模型自主完成一个完整的业务任务"。前者是单轮对话的艺术，后者是多步推理、工具调用、状态管理和异常处理的系统工程。EIOS 自定义 Agent 开发框架（@eios/agent-framework）将 Agent 开发的复杂度抽象为三个清晰的层级。层一：角色定义（Persona）——用自然语言描述 Agent 的身份、职责、行为边界和输出规范。层二：能力装备（Tools & Knowledge）——为 Agent 绑定它需要的工具（API 调用、数据库查询、代码执行等）和知识源（知识库文档、企业规章制度、行业标准等）。层三：编排逻辑（Orchestration）——定义 Agent 在复杂场景下的决策流程：何时调用哪个工具、如何验证工具返回、何时向人类求助、如何处理异常。框架底层集成了 LangGraph 的有向图引擎，支持条件分支、循环和并行子任务。开发者用 YAML 或 TypeScript 定义 Agent，框架自动生成可执行的推理图，部署后通过标准 API 端点调用。从"想做一个 Agent"到"第一个可调用的版本"，熟练开发者可以在 30 分钟内完成。

图1：Agent 开发框架三层架构——角色定义、能力装备与编排逻辑的分层设计

二、第一步——定义角色：一句话启动 Agent 的灵魂

角色定义是 Agent 开发的起点，也是决定 Agent 行为质量的最关键步骤。EIOS 提供了 角色描述语言（PDL, Persona Description Language），一种结构化的 YAML 格式来精确定义 Agent 的行为边界。一个完整的角色定义包含六个部分：身份声明（"你是一位资深的法律合同审查专家，拥有 15 年公司法务经验"）、目标说明（"审查用户提交的合同文本，识别风险条款、缺失条款和模糊表述"）、行为规则（"绝对不提供法律建议，仅指出潜在风险点；引用具体条款原文；使用中文输出；不确定时标注'需人工审核'"）、工具使用指南（"优先检索知识库中的参考合同模板；遇到金额相关条款时调用计算器验证数值一致性"）、输出格式（"按风险等级分为严重/一般/建议三级，每条风险附条款原文、风险分析和参考案例"）和边界与升级（"当检测到涉及刑事合规的条款时，立即停止审查并建议联系公司法务负责人"）。系统提供 50+ 预置角色模板 覆盖客服、法务、财务、HR、运维、数据分析等常见领域，开发者可以直接克隆模板并微调。

图2：角色定义——六段式 PDL 模板 + 50+ 预置角色，从模板克隆到微调只需几分钟

三、第二步——配置工具：赋予 Agent 行动的能力

角色给了 Agent "思考的大脑"，工具给了它"行动的双手"。EIOS 的工具系统基于 OpenAPI 3.1 + 函数调用规范，支持三种工具来源。第一种，内置工具库——平台预置了 80+ 常用工具：知识库检索（RAG）、网页搜索、文档解析（PDF/Word/Excel）、邮件发送、日历查询、数据计算、代码沙箱执行、HTTP 请求等。开发者通过勾选和参数配置即可启用，无需编写代码。第二种，自定义 API 工具——上传一个 OpenAPI 3.x 规范文件（JSON 或 YAML），系统自动将每个端点解析为一个可调用的工具，并以 AI 友好的方式重新描述参数语义。例如，一个 CRM 系统的 GET /customers/{id} 端点被自动描述为"根据客户 ID 查询客户的完整信息，包括姓名、联系方式、合同列表和最近联系记录"。第三种，自定义函数工具——直接在控制台的代码编辑器中编写工具逻辑（支持 Python 和 TypeScript），运行在 EIOS 的安全沙箱中。自定义函数工具支持入参 Zod/JSON Schema 校验、异步执行、超时控制和标准错误返回格式。工具可以配置为"自动执行"（Agent 自主决定何时调用）或"需人工审批"（Agent 提议调用，等待人类确认后执行），适合转账、删除数据等敏感操作。

图3：工具配置——内置工具库、OpenAPI 自动导入和自定义函数三种方式，按需组合

四、第三步——测试与发布：确保 Agent 的行为符合预期

Agent 定义完成之后，在发布之前必须通过充分测试。EIOS 提供了 Agent Playground——一个交互式测试环境，开发者可以在其中输入测试用例，观察 Agent 的完整执行过程（每一步推理、每次工具调用及其结果、最终输出），就像调试普通代码一样调试 Agent 行为。Playground 支持 批量回归测试：上传一个 CSV 文件（包含测试输入和期望的 Agent 行为描述），系统自动逐个执行并标记通过/失败的用例。测试通过后，进入发布阶段。点击"发布"，系统自动执行 发布前检查清单：角色定义完整性、工具可用性验证、权限合规检查、Token 消耗估算和安全审查。检查全部通过后，Agent 被发布到指定的环境（沙箱、预发布或生产），并获得一个唯一的 Agent ID 和对应的 API 端点（POST /v1/agents/{agent_id}/execute）。发布后的 Agent 进入持续监控模式——控制台展示调用量、成功率、平均耗时、用户满意度评分和常见错误类型，开发者可以基于这些指标持续优化 Agent 配置。

图4：Agent Playground——交互式调试、批量回归测试和发布前自动检查的完整质量闭环

五、高级模式：多 Agent 编排与状态管理

单个 Agent 适合解决边界清晰的任务，但真实的企业业务往往需要多个 Agent 协同工作。EIOS 的 Agent 框架原生支持 多 Agent 编排模式。模式一：主管-专家模式（Supervisor-Worker）——一个主管 Agent 接收用户请求，分析任务后将其分解为子任务分派给对应的专家 Agent（如法务 Agent、财务 Agent、技术 Agent），汇总各子任务结果后生成综合回复。主管 Agent 使用框架内置的 delegate_to 工具进行子任务分派，自动处理子任务超时、失败重试和结果聚合。模式二：顺序流水线模式（Sequential Pipeline）——多个 Agent 按固定顺序处理数据，前一个 Agent 的输出作为下一个 Agent 的输入（如：文档解析 Agent → 内容摘要 Agent → 翻译 Agent → 排版 Agent）。模式三：辩论模式（Debate/Critique）——两个 Agent 分别负责"生成"和"批判"，生成 Agent 产出初稿，批判 Agent 从准确性、完整性、合规性等维度提出修改意见，生成 Agent 根据意见修改，循环至质量达标。框架还提供了 会话状态管理——Agent 的执行上下文（包括对话历史、工具调用日志和中间数据）可序列化存储至 Redis 或 PostgreSQL，支持长对话跨多次 HTTP 请求延续，也支持执行中断后从断点恢复。

图5：多 Agent 编排——主管-专家、顺序流水线和辩论模式，加上断点恢复的会话状态管理

六、Agent 市场与社区贡献

当开发者创建了优秀的 Agent 之后，它的价值不应局限于单个团队。EIOS 的 Agent 模板市场 允许开发者将自己的 Agent 配置（包括角色定义、工具配置和最佳实践提示词）以模板形式公开发布或仅团队内共享。模板发布需要经过 质量审核——平台自动检查角色定义完整性、工具可用性和安全合规性，然后由 EIOS 开发者关系团队进行人工复审。审核通过的模板出现在公共市场中，其他开发者可以一键克隆并根据自己的需求进行定制。每个模板页面展示调用量、用户评分和评价，优质模板的作者将获得 收入分成——当其他开发者使用该模板的生产调用量超过一定阈值时，模板作者获得相应的 API 额度奖励或现金分成。社区还定期举办 Agent 黑客松，围绕特定行业主题（如"最佳医疗问诊 Agent"或"最佳合同审查 Agent"）评比出最优秀的作品，获胜者获得 EIOS 开发者大会的演讲机会和平台首页推荐位。

图6：Agent 模板市场——从发布到审核、从使用评价到收入分成的完整社区生态