diff --git a/README.md b/README.md index 2a7f3533..4e5eacb8 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # AI 编程 Code Agent 对比 -> 基于源码分析和二进制反编译的 17 款 AI 编程 Code Agent 全面对比 | 120+ 文件 | 36,000+ 行 | 21 篇 Deep-Dive | 9 个 EVIDENCE.md +> 基于源码分析和二进制反编译的 18 款 AI 编程 Code Agent 全面对比 | 120+ 文件 | 36,000+ 行 | 21 篇 Deep-Dive | 9 个 EVIDENCE.md [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) @@ -88,6 +88,7 @@ | [Kimi CLI](./docs/tools/kimi-cli/) | 月之暗面 | Apache-2.0 | **7k** | Python | 6 | Wire 协议,D-Mail 时间回溯 | | [Cursor](./docs/tools/cursor-cli.md) | Cursor | 专有 | - | TypeScript | 多种 | AI 原生 IDE,Background Agent | | [Qoder CLI](./docs/tools/qoder-cli/) | QoderAI | 专有 | - | Go | 多种 | Quest 模式,Claude Code 兼容 | +| [Oh My OpenAgent](./docs/tools/oh-my-openagent.md) | code-yeongyu | SUL-1.0 | **~44k** | TypeScript | 多种 | OpenCode Harness 层,7~10 Discipline Agent | --- diff --git a/docs/comparison/architecture-deep-dive.md b/docs/comparison/architecture-deep-dive.md index 3ab1558c..37bbd8c9 100644 --- a/docs/comparison/architecture-deep-dive.md +++ b/docs/comparison/architecture-deep-dive.md @@ -606,3 +606,5 @@ Harness(环境设计) ``` **关键实证**:LangChain coding agent 仅修改 Harness(不改模型),Terminal Bench 2.0 分数从 52.8% 提升到 66.5%——表明 Harness 优化可以在不更换模型的情况下带来显著性能提升。详见[构建自己的 AI 编程 Agent](../guides/build-your-own-agent.md)中的「Harness Engineering」章节。 + +**实践案例**:[Oh My OpenAgent](../tools/oh-my-openagent.md)(~44K Stars)在 OpenCode 之上构建了 7~10 个 Discipline Agent 编排 + 分类模型路由 + Hash-Anchored Edit,是目前最成功的开源 Harness 层实践。 diff --git a/docs/comparison/model-routing.md b/docs/comparison/model-routing.md index 2b1550a9..96c3911f 100644 --- a/docs/comparison/model-routing.md +++ b/docs/comparison/model-routing.md @@ -350,6 +350,8 @@ goose --model claude-opus-4 # 启动时指定 3. **Fallback 将成为标配** — 随着 AI 编程代理用于生产环境,API 容错能力不再是可选项 4. **路由决策可解释性** — Gemini CLI 的 `reasoning` 字段是正确方向,用户需要理解为什么选了某个模型 +5. **Harness 层路由** — Oh My OpenAgent 在 OpenCode 之上实现了按任务类别(visual-engineering/deep/quick/ultrabrain)自动路由到不同模型的 Discipline Agent 系统,证明模型路由可以在 Harness 层而非 Agent 内核实现。详见 [Oh My OpenAgent](../tools/oh-my-openagent.md)。 + --- ## 证据来源 diff --git a/docs/tools/README.md b/docs/tools/README.md index db73a8bb..69952f15 100644 --- a/docs/tools/README.md +++ b/docs/tools/README.md @@ -26,6 +26,7 @@ | [SWE-agent](./swe-agent.md) | 单文件 | 178 | SWE-bench 74%+,Docker 沙箱 | | [Cline](./cline.md) | 单文件 | 151 | VS Code 扩展,24+ 工具,子代理系统 | | [OpenHands](./openhands.md) | 单文件 | 144 | SWE-bench 77.6%,浏览器操作,Docker | +| [Oh My OpenAgent](./oh-my-openagent.md) | 单文件 | — | OpenCode Harness 层,7~10 Discipline Agent 编排,~44K Stars | | [mini-swe-agent](./mini-swe-agent.md) | 单文件 | 93 | 教学用,SWE-bench 74%+ | ## 对比文档 diff --git a/docs/tools/oh-my-openagent.md b/docs/tools/oh-my-openagent.md new file mode 100644 index 00000000..9e00245a --- /dev/null +++ b/docs/tools/oh-my-openagent.md @@ -0,0 +1,130 @@ +# Oh My OpenAgent + +**开发者:** code-yeongyu(韩国) +**许可证:** SUL-1.0(Sustainable Use License) +**仓库:** [github.com/code-yeongyu/oh-my-openagent](https://github.com/code-yeongyu/oh-my-openagent) +**官网:** [ohmyopenagent.com](https://ohmyopenagent.com/) +**Stars:** ~44K(2026-03) +**语言:** TypeScript +**基座:** 基于 OpenCode 的 Harness/扩展层 +**最后更新:** 2026-03-28(多次日更) + +## 概述 + +Oh My OpenAgent(原 oh-my-opencode)是一个基于 OpenCode 的 **Agent Harness 层**,不是独立的 Agent——它在 OpenCode 之上添加了多代理编排、多模型路由和增强工具链。自称 "the best agent harness",~44K Stars(2025-12 创建至 2026-03,基于 GitHub 数据)。 + +与本项目收录的其他 Agent 的关键区别:**它不是从零构建的 Agent,而是 Harness Engineering 的实践案例**——在成品 Agent(OpenCode)之上设计环境、编排和反馈循环。 + +## 核心架构 + +### Discipline Agent 系统(多代理编排) + +``` +用户输入 → IntentGate(意图分析) + │ + └── Sisyphus(编排者/CTO) + ├── 任务分解 + 路由到专用代理 + ├── Hephaestus(深度工作者) + ├── Prometheus(规划者/Metis) + ├── Oracle(架构/调试专家) + ├── Librarian(文档搜索专家) + ├── Explore(代码搜索专家) + └── Multimodal Looker(视觉代理) +``` + +7~10 个代理以希腊神话(Sisyphus/Prometheus/Hephaestus/Atlas/Metis/Momus)和英文职能(Oracle/Librarian/Explore/Multimodal Looker)混合命名,由 Sisyphus 作为 CTO 统一调度。 + +> **注**:GitHub README 和官网列出的代理数量不一致(GitHub 列出 7 个,官网列出 10 个含 Atlas/Momus/Dynamic Agent)。以上为两处来源的合集。 + +### 分类模型路由 + +| 任务类别 | 路由模型 | 说明 | +|---------|---------|------| +| visual-engineering | Claude Opus | 视觉/前端相关 | +| deep | GPT-5.4 / Kimi K2.5 | 深度推理任务 | +| quick | GLM-5 / Gemini | 轻量级快速任务 | +| ultrabrain | 最强可用模型 | 极难推理任务 | + +> **注**:以上模型名称为 Oh My OpenAgent 项目自述的路由配置,部分模型名称(如 GPT-5.4、GLM-5)未经独立验证,实际可用模型可能有所不同。 + +### Hash-Anchored Edit Tool + +使用 `LINE#ID` 内容哈希验证每次编辑,声称零过期行错误——解决了 LLM 编辑时行号偏移导致的错乱问题。 + +### ultrawork 命令 + +一个自迭代执行循环(GitHub README 称 "Ralph Loop",官网称 "Self-Correction Loops"),激活所有代理持续工作直到任务 100% 完成。可同时启动 5+ 个后台专用代理并行执行。 + +## 独特功能 + +| 功能 | 说明 | +|------|------| +| **IntentGate** | 分析用户意图后再分类/执行,避免字面误解 | +| **Skill-Embedded MCPs** | Skill 携带自己的 MCP 服务器,避免上下文膨胀 | +| **内置 MCPs** | Exa Web 搜索、Context7、Grep.app | +| **LSP 集成** | 语言服务器协议集成(诊断/补全) | +| **AST-Grep** | 基于 AST 的代码搜索(比正则更精确) | +| **Tmux 集成** | 多窗格并行代理执行 | +| **Claude Code 兼容** | 兼容 Claude Code hooks、commands、skills、MCPs、plugins | + +## 与其他 Agent 的定位对比 + +| 维度 | Oh My OpenAgent | Claude Code | Codex CLI | OpenCode | +|------|----------------|-------------|-----------|----------| +| **本质** | Harness 层(扩展 OpenCode) | 独立 Agent | 独立 Agent | 独立 Agent | +| **模型支持** | 多模型路由(6+ 提供商) | Claude 专属 | OpenAI 专属 | 多模型 | +| **多代理** | 7~10 Discipline Agent | Teammates | 实验性 | 无 | +| **模型路由** | 按任务类别自动路由 | 手动选择 | 无 | 手动选择 | +| **编辑精度** | Hash-Anchored(LINE#ID) | Edit/MultiEdit | apply_patch | 继承 | +| **Stars** | ~44K | N/A(闭源) | ~68K | ~12K(已归档) | +| **许可证** | SUL-1.0 | 专有 | Apache-2.0 | MIT | + +## Harness Engineering 视角 + +Oh My OpenAgent 是 [Harness Engineering](../guides/build-your-own-agent.md) 概念的典型实践: + +| Harness 支柱 | 实现方式 | +|-------------|---------| +| **文档即系统** | 继承 OpenCode 的 AGENTS.md + CLAUDE.md 读取 | +| **架构约束** | Discipline Agent 强制分工——编排/深度/规划分离 | +| **反馈循环** | Ralph Loop 自迭代 + LSP 诊断反馈 | +| **熵管理** | Hash-Anchored Edit 防止编辑漂移 | +| **渐进自治** | ultrawork 一键全自动 + IntentGate 意图理解 | + +> **核心洞察**:Oh My OpenAgent 证明了 Harness 层可以在不修改底层 Agent(OpenCode)的情况下,通过编排、路由和工具增强带来显著的体验提升。这与 OpenAI Harness Engineering 文章的核心论点一致——"改进 Harness 可以在不更换模型的情况下带来显著性能提升"。 + +## 安装 + +```bash +bunx oh-my-opencode install +``` + +安装后提供独立二进制(macOS/Linux/Windows),无需 Bun/Node 运行时。依赖 OpenCode 作为基座运行。 + +## 优势 + +1. **多代理编排**——7~10 个 Discipline Agent 按职能自动分工,Sisyphus 统一调度 +2. **多模型路由**——按任务类别自动选择最优模型(visual/deep/quick/ultrabrain) +3. **Hash-Anchored Edit**——内容哈希验证编辑精确性,防止行号偏移 +4. **快速迭代**——多次日更,社区活跃(~44K Stars,4 个月) +5. **Claude Code 兼容**——兼容 Claude Code hooks/commands/skills/MCPs/plugins + +## 劣势 + +1. **基座已归档**——OpenCode(opencode-ai/opencode)于 2025 年 9 月归档,长期可持续性存在风险 +2. **非标准许可证**——SUL-1.0(Sustainable Use License),禁止商业使用和分发(仅限内部业务/非商业用途) +3. **宣传语气较强**——技术声明(如"零过期行错误")为项目自述,未经独立验证 +4. **AI 参与开发**——项目有 AI 贡献者账号(sisyphus-dev-ai),代码质量需额外关注 + +## 使用场景 + +- **最适合**:需要多模型路由 + 多代理编排的复杂项目,团队已熟悉 OpenCode +- **适合**:想在不锁定单一模型的情况下使用 Claude/GPT/Gemini 等多种模型 +- **不太适合**:需要长期稳定维护的企业项目(基座已归档),对许可证有严格要求的场景 + +## 资源链接 + +- [GitHub 仓库](https://github.com/code-yeongyu/oh-my-openagent) +- [官方文档](https://ohmyopenagent.com/) + +> **免责声明**:以上数据基于 2026 年 3 月分析,Stars/功能等数据可能已过时。技术声明(如"零过期行错误")为项目自述,未经独立验证。