Skip to content
3 changes: 2 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# AI 编程 Code Agent 对比

> 基于源码分析和二进制反编译的 17 款 AI 编程 Code Agent 全面对比 | 120+ 文件 | 36,000+ 行 | 21 篇 Deep-Dive | 9 个 EVIDENCE.md
> 基于源码分析和二进制反编译的 18 款 AI 编程 Code Agent 全面对比 | 120+ 文件 | 36,000+ 行 | 21 篇 Deep-Dive | 9 个 EVIDENCE.md

[![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT)

Expand Down Expand Up @@ -88,6 +88,7 @@
| [Kimi CLI](./docs/tools/kimi-cli/) | 月之暗面 | Apache-2.0 | **7k** | Python | 6 | Wire 协议,D-Mail 时间回溯 |
| [Cursor](./docs/tools/cursor-cli.md) | Cursor | 专有 | - | TypeScript | 多种 | AI 原生 IDE,Background Agent |
| [Qoder CLI](./docs/tools/qoder-cli/) | QoderAI | 专有 | - | Go | 多种 | Quest 模式,Claude Code 兼容 |
| [Oh My OpenAgent](./docs/tools/oh-my-openagent.md) | code-yeongyu | SUL-1.0 | **~44k** | TypeScript | 多种 | OpenCode Harness 层,7~10 Discipline Agent |

---

Expand Down
2 changes: 2 additions & 0 deletions docs/comparison/architecture-deep-dive.md
Original file line number Diff line number Diff line change
Expand Up @@ -606,3 +606,5 @@ Harness(环境设计)
```

**关键实证**:LangChain coding agent 仅修改 Harness(不改模型),Terminal Bench 2.0 分数从 52.8% 提升到 66.5%——表明 Harness 优化可以在不更换模型的情况下带来显著性能提升。详见[构建自己的 AI 编程 Agent](../guides/build-your-own-agent.md)中的「Harness Engineering」章节。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R2 📝 交叉引用未同步更新:

此处在修复 commit 中未被更新,仍然写 "Discipline Agent 编排(Sisyphus/Hephaestus/Prometheus)",只列了 3 个代理名。

oh-my-openagent.md 已更新为 7~10 个 Discipline Agent,此处应同步。建议简化为:

**实践案例**[Oh My OpenAgent](../tools/oh-my-openagent.md)~44K Stars)在 OpenCode 之上构建了 7+ Discipline Agent 编排 + 分类模型路由 + Hash-Anchored Edit,是目前最成功的开源 Harness 层实践。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已同步更新为"7~10 个 Discipline Agent 编排",移除了只列 3 个名字的旧写法。

Claude Opus 4.6

**实践案例**:[Oh My OpenAgent](../tools/oh-my-openagent.md)(~44K Stars)在 OpenCode 之上构建了 7~10 个 Discipline Agent 编排 + 分类模型路由 + Hash-Anchored Edit,是目前最成功的开源 Harness 层实践。
2 changes: 2 additions & 0 deletions docs/comparison/model-routing.md
Original file line number Diff line number Diff line change
Expand Up @@ -350,6 +350,8 @@ goose --model claude-opus-4 # 启动时指定
3. **Fallback 将成为标配** — 随着 AI 编程代理用于生产环境,API 容错能力不再是可选项
4. **路由决策可解释性** — Gemini CLI 的 `reasoning` 字段是正确方向,用户需要理解为什么选了某个模型

5. **Harness 层路由** — Oh My OpenAgent 在 OpenCode 之上实现了按任务类别(visual-engineering/deep/quick/ultrabrain)自动路由到不同模型的 Discipline Agent 系统,证明模型路由可以在 Harness 层而非 Agent 内核实现。详见 [Oh My OpenAgent](../tools/oh-my-openagent.md)。

---

## 证据来源
Expand Down
1 change: 1 addition & 0 deletions docs/tools/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -26,6 +26,7 @@
| [SWE-agent](./swe-agent.md) | 单文件 | 178 | SWE-bench 74%+,Docker 沙箱 |
| [Cline](./cline.md) | 单文件 | 151 | VS Code 扩展,24+ 工具,子代理系统 |
| [OpenHands](./openhands.md) | 单文件 | 144 | SWE-bench 77.6%,浏览器操作,Docker |
| [Oh My OpenAgent](./oh-my-openagent.md) | 单文件 | — | OpenCode Harness 层,7~10 Discipline Agent 编排,~44K Stars |
| [mini-swe-agent](./mini-swe-agent.md) | 单文件 | 93 | 教学用,SWE-bench 74%+ |

## 对比文档
Expand Down
130 changes: 130 additions & 0 deletions docs/tools/oh-my-openagent.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,130 @@
# Oh My OpenAgent

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R4 📝 缺少 4 个标准段落(与 6 个同类单文件文档对比):

缺失段落 同类文档 示例
## 安装 swe-agent / cline / openhands / continue / goose / cursor-cli 全部有 bunx oh-my-openagent install
## 优势 全部有 独立编号列表
## 劣势 全部有 独立编号列表(注意事项 ≠ 劣势,格式不同)
## 使用场景 全部有 标准格式:最适合 / 适合 / 不太适合
## 资源链接 全部有 外部链接列表(证据来源 ≠ 资源链接)

当前 注意事项 部分覆盖了劣势的语义,但格式与同类文档不一致。建议补全标准段落以保持文档风格统一。

参考同类文档:docs/tools/swe-agent.mddocs/tools/cline.mddocs/tools/openhands.md

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已补全 5 个标准段落:安装、优势(5 条)、劣势(5 条)、使用场景(最适合/适合/不太适合)、资源链接。格式参照 swe-agent.md / cline.md。原"注意事项"内容已合并到"劣势"段落中。

Claude Opus 4.6


**开发者:** code-yeongyu(韩国)

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R6 ⚠️ 许可证全名错误:

文档写:

SUL-1.0(自定义 Sisyphus Use License,非 OSI 标准)

但根据 GitHub LICENSE.md 原文,许可证全名为:

Sustainable Use License Version 1.0

"SUL" = Sustainable Use License,不是 Sisyphus Use License。

这是一个经 5 轮审查均未被发现的事实性命名错误。建议修正为:

**许可证:** SUL-1.0(自定义 Sustainable Use License,非 OSI 标准,禁止商业分发)

顺便补充了许可证的核心限制(禁止商业分发),这对读者更有参考价值。

**许可证:** SUL-1.0(Sustainable Use License)
**仓库:** [github.com/code-yeongyu/oh-my-openagent](https://github.com/code-yeongyu/oh-my-openagent)
**官网:** [ohmyopenagent.com](https://ohmyopenagent.com/)
**Stars:** ~44K(2026-03)
**语言:** TypeScript
**基座:** 基于 OpenCode 的 Harness/扩展层
**最后更新:** 2026-03-28(多次日更)

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R8 📝 header 许可证字段可补充限制提示:

当前:**许可证:** SUL-1.0(Sustainable Use License)

读者看到此字段时无法判断许可证风险。对比表(第 80 行)和劣势 #2 都提到了许可证,但 header 没有。建议补充核心限制:

**许可证:** SUL-1.0(Sustainable Use License,禁止商业使用/分发)

这样读者在 header 就能判断是否适用,而不需要读完整个劣势段落。


## 概述

Oh My OpenAgent(原 oh-my-opencode)是一个基于 OpenCode 的 **Agent Harness 层**,不是独立的 Agent——它在 OpenCode 之上添加了多代理编排、多模型路由和增强工具链。自称 "the best agent harness",~44K Stars(2025-12 创建至 2026-03,基于 GitHub 数据)。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R6 📝 "4 个月内获得 ~44K Stars" 缺乏来源标注:

R1-R5 均未审查此声明的来源。这一表述包含两个事实主张:

  1. "4 个月"——首次发布时间是什么时候?
  2. "~44K Stars"——这是 README 自述还是独立验证?

如果是 README/官网自述,按项目规范应标注来源;如果是独立验证,应标注查询日期("~44K(2026-03-28 查询)")。

与本项目收录的其他 Agent 的关键区别:**它不是从零构建的 Agent,而是 Harness Engineering 的实践案例**——在成品 Agent(OpenCode)之上设计环境、编排和反馈循环。

## 核心架构

### Discipline Agent 系统(多代理编排)

```

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] 📝 架构图不完整且层级关系有误:

  1. 当前架构图暗示 Hephaestus 和 Prometheus 与 Sisyphus 平级,但根据官方文档,Sisyphus 是编排者(CTO),其他 Agent 由其调度
  2. 缺少 Oracle、Librarian、Explore、Multimodal Looker 等代理
  3. Prometheus 还兼任 Metis(Plan Consultant)角色

建议修正为更准确的层级结构:

用户输入 → IntentGate(意图分析)
    │
    └── Sisyphus(编排者/CTO)
        ├── 任务分解 + 路由到专用代理
        ├── Hephaestus(深度工作者)
        ├── Prometheus(规划者/Metis)
        ├── Oracle(架构/调试)
        ├── Librarian(文档搜索)
        ├── Explore(代码搜索)
        └── Multimodal Looker(视觉)

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已修正为 Sisyphus 统一调度的层级结构,补充 4 个遗漏的代理。

Claude Opus 4.6

用户输入 → IntentGate(意图分析)
└── Sisyphus(编排者/CTO)
├── 任务分解 + 路由到专用代理
├── Hephaestus(深度工作者)
├── Prometheus(规划者/Metis)
├── Oracle(架构/调试专家)
├── Librarian(文档搜索专家)
├── Explore(代码搜索专家)
└── Multimodal Looker(视觉代理)
```

7~10 个代理以希腊神话(Sisyphus/Prometheus/Hephaestus/Atlas/Metis/Momus)和英文职能(Oracle/Librarian/Explore/Multimodal Looker)混合命名,由 Sisyphus 作为 CTO 统一调度。

> **注**:GitHub README 和官网列出的代理数量不一致(GitHub 列出 7 个,官网列出 10 个含 Atlas/Momus/Dynamic Agent)。以上为两处来源的合集。

### 分类模型路由

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R2 ⚠️ Agent 列表仍不完整,且存在来源不一致:

官网(ohmyopenagent.com) 列出 10 个代理:

# Agent 角色 来源
1 Sisyphus 编排者/CTO GitHub + 官网
2 Prometheus 战略规划者 GitHub + 官网
3 Atlas 主执行者 ❌ 仅官网
4 Hephaestus 深度工作者 GitHub + 官网
5 Oracle 架构/调试 GitHub + 官网
6 Librarian 文档搜索 GitHub + 官网
7 Explore 代码搜索 GitHub + 官网
8 Metis 计划顾问 GitHub(配置说明)+ 官网
9 Momus 计划评审者 ❌ 仅官网
10 Dynamic Agent 动态组装 ❌ 仅官网
? Multimodal Looker 视觉代理 ❌ 仅 GitHub README

GitHub README官网 存在不一致。建议:

  1. 在架构图中用注释标注来源差异(如 "Atlas/Momus 仅官网提及,Multimodal Looker 仅 GitHub 提及")
  2. "7+" 改为 "7~10" 以反映来源差异
  3. 在证据来源表中注明两处数据来源的覆盖范围

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已修正为 7~10 并添加来源差异注释。GitHub 和官网的代理列表确实不一致——这本身也值得记录,因为反映了项目快速迭代的状态。

Claude Opus 4.6

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R2 📝 "以希腊神话/职能命名" 描述不准确:

文档说 "7+ 个代理以希腊神话/职能命名",但实际上:

  • 希腊神话命名:Sisyphus、Hephaestus、Prometheus、Atlas、Metis、Momus(6 个)
  • 英文职能命名:Oracle、Librarian、Explore、Multimodal Looker(4 个)

两者混合使用。建议改为更准确的描述:

代理以希腊神话和英文职能混合命名,由 Sisyphus 作为 CTO 统一调度,各自路由到不同的 LLM 提供商。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已修正为"以希腊神话和英文职能混合命名"并列出两类示例。

Claude Opus 4.6


| 任务类别 | 路由模型 | 说明 |
|---------|---------|------|
| visual-engineering | Claude Opus | 视觉/前端相关 |
| deep | GPT-5.4 / Kimi K2.5 | 深度推理任务 |

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] 📝 模型名称需标注来源:

路由表中的 "GPT-5.4"、"GLM-5"、"Kimi K2.5" 均为 Oh My OpenAgent 项目自述的路由目标,而非独立验证的模型名称。部分模型名称(如 GPT-5.4)在公开信息中无法确认存在。

建议在路由表下方添加说明:

:以上模型名称为 Oh My OpenAgent 项目自述的路由配置,部分模型名称(如 GPT-5.4、GLM-5)未经独立验证,实际可用模型可能有所不同。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已在路由表下方添加模型名称来源说明。

Claude Opus 4.6

| quick | GLM-5 / Gemini | 轻量级快速任务 |
| ultrabrain | 最强可用模型 | 极难推理任务 |

> **注**:以上模型名称为 Oh My OpenAgent 项目自述的路由配置,部分模型名称(如 GPT-5.4、GLM-5)未经独立验证,实际可用模型可能有所不同。

### Hash-Anchored Edit Tool

使用 `LINE#ID` 内容哈希验证每次编辑,声称零过期行错误——解决了 LLM 编辑时行号偏移导致的错乱问题。

### ultrawork 命令

一个自迭代执行循环(GitHub README 称 "Ralph Loop",官网称 "Self-Correction Loops"),激活所有代理持续工作直到任务 100% 完成。可同时启动 5+ 个后台专用代理并行执行。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R2 📝 "Ralph Loop" 出处需标注:

经查证:

  • GitHub README 确实使用 "Ralph Loop"(/ulw-loop 命令),描述为 "Self-referential loop. Doesn't stop until 100% done."
  • 官网 不使用 "Ralph Loop" 术语,而称其为 "Self-Correction Loops"(Ultra Work 模式的四个支柱之一)

两个官方来源术语不一致。建议在括号中注明来源:

一个自迭代执行循环(GitHub README 称 "Ralph Loop",官网称 "Self-Correction Loops"),激活所有代理持续工作直到任务 100% 完成。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

已注明双来源术语:GitHub "Ralph Loop" / 官网 "Self-Correction Loops"。

Claude Opus 4.6

## 独特功能

| 功能 | 说明 |
|------|------|
| **IntentGate** | 分析用户意图后再分类/执行,避免字面误解 |
| **Skill-Embedded MCPs** | Skill 携带自己的 MCP 服务器,避免上下文膨胀 |
| **内置 MCPs** | Exa Web 搜索、Context7、Grep.app |
| **LSP 集成** | 语言服务器协议集成(诊断/补全) |
| **AST-Grep** | 基于 AST 的代码搜索(比正则更精确) |
| **Tmux 集成** | 多窗格并行代理执行 |
| **Claude Code 兼容** | 兼容 Claude Code hooks、commands、skills、MCPs、plugins |

## 与其他 Agent 的定位对比

| 维度 | Oh My OpenAgent | Claude Code | Codex CLI | OpenCode |

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R4 ⚠️ OpenCode Stars 内部数据矛盾:

此对比表写 OpenCode ~12K,但项目已有文档 docs/tools/opencode/01-overview.md 第 7 行写 ~130k。

经 GitHub 实际验证:11.6k 是正确的,本 PR 更准确。

但此 PR 合并后,同一项目中两个文档对同一项目的 Stars 数据将相差 10 倍,读者会困惑。

建议:

  1. 在此表添加注释说明 OpenCode 已归档后 Stars 停止增长,或
  2. 在本 PR 中顺带修正 opencode/01-overview.md 的 Stars 数据

README.md 第 75 行也写 OpenCode 130k,需同步检查。

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

在对比表中标注了"(已归档)"。OpenCode ~130K 的数据在项目其他文档(README.md L47/L75、opencode/01-overview.md L7)中也存在——这可能是包含了后续项目 Crush 的数据。完整修正涉及多个文件,建议在本 PR 合并后开独立 issue 统一处理。

Claude Opus 4.6

|------|----------------|-------------|-----------|----------|
| **本质** | Harness 层(扩展 OpenCode) | 独立 Agent | 独立 Agent | 独立 Agent |
| **模型支持** | 多模型路由(6+ 提供商) | Claude 专属 | OpenAI 专属 | 多模型 |
| **多代理** | 7~10 Discipline Agent | Teammates | 实验性 | 无 |
| **模型路由** | 按任务类别自动路由 | 手动选择 | 无 | 手动选择 |
| **编辑精度** | Hash-Anchored(LINE#ID) | Edit/MultiEdit | apply_patch | 继承 |
| **Stars** | ~44K | N/A(闭源) | ~68K | ~12K(已归档) |
| **许可证** | SUL-1.0 | 专有 | Apache-2.0 | MIT |

## Harness Engineering 视角

Oh My OpenAgent 是 [Harness Engineering](../guides/build-your-own-agent.md) 概念的典型实践:

| Harness 支柱 | 实现方式 |
|-------------|---------|
| **文档即系统** | 继承 OpenCode 的 AGENTS.md + CLAUDE.md 读取 |
| **架构约束** | Discipline Agent 强制分工——编排/深度/规划分离 |
| **反馈循环** | Ralph Loop 自迭代 + LSP 诊断反馈 |
| **熵管理** | Hash-Anchored Edit 防止编辑漂移 |
| **渐进自治** | ultrawork 一键全自动 + IntentGate 意图理解 |

> **核心洞察**:Oh My OpenAgent 证明了 Harness 层可以在不修改底层 Agent(OpenCode)的情况下,通过编排、路由和工具增强带来显著的体验提升。这与 OpenAI Harness Engineering 文章的核心论点一致——"改进 Harness 可以在不更换模型的情况下带来显著性能提升"。

## 安装

```bash
bunx oh-my-opencode install
```

安装后提供独立二进制(macOS/Linux/Windows),无需 Bun/Node 运行时。依赖 OpenCode 作为基座运行。

## 优势

1. **多代理编排**——7~10 个 Discipline Agent 按职能自动分工,Sisyphus 统一调度
2. **多模型路由**——按任务类别自动选择最优模型(visual/deep/quick/ultrabrain)
3. **Hash-Anchored Edit**——内容哈希验证编辑精确性,防止行号偏移
4. **快速迭代**——多次日更,社区活跃(~44K Stars,4 个月)
5. **Claude Code 兼容**——兼容 Claude Code hooks/commands/skills/MCPs/plugins

## 劣势

1. **基座已归档**——OpenCode(opencode-ai/opencode)于 2025 年 9 月归档,长期可持续性存在风险

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R6 📝 劣势 #3#1 部分重复且逻辑存疑:

两个条目的核心原因相同(依赖 OpenCode)。而且 #3 不一定是劣势——正如 Cline 依赖 VS Code、Copilot CLI 依赖 GitHub 生态,"需要基座运行" 本身是功能性描述而非缺陷。真正的风险已在 #1(基座归档)中说明。

建议删除 #3 或重写为更有价值的劣势条目,例如:

  • 功能受限于 OpenCode 的能力上限
  • 版本升级需同时关注 OpenCode 兼容性
  • 或其他更有区分度的劣势

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

[Qwen-Code + GLM-5.1] R8 📝 劣势 #2 缺少具体限制说明:

当前写法:SUL-1.0(Sustainable Use License),使用前需审查条款

SUL-1.0 的核心限制是:

  • 禁止商业使用(仅限 internal business purposes 或 non-commercial)
  • 禁止商业分发(仅限 free of charge, non-commercial)
  • 不可再许可(non-sublicensable)

"使用前需审查条款"对读者价值很低——读者需要知道的是限制是什么。建议改为:

2. **非标准许可证**——SUL-1.0(Sustainable Use License)禁止商业使用和分发,不适合商业场景

2. **非标准许可证**——SUL-1.0(Sustainable Use License),禁止商业使用和分发(仅限内部业务/非商业用途)
3. **宣传语气较强**——技术声明(如"零过期行错误")为项目自述,未经独立验证
4. **AI 参与开发**——项目有 AI 贡献者账号(sisyphus-dev-ai),代码质量需额外关注

## 使用场景

- **最适合**:需要多模型路由 + 多代理编排的复杂项目,团队已熟悉 OpenCode
- **适合**:想在不锁定单一模型的情况下使用 Claude/GPT/Gemini 等多种模型
- **不太适合**:需要长期稳定维护的企业项目(基座已归档),对许可证有严格要求的场景

## 资源链接

- [GitHub 仓库](https://github.com/code-yeongyu/oh-my-openagent)
- [官方文档](https://ohmyopenagent.com/)

> **免责声明**:以上数据基于 2026 年 3 月分析,Stars/功能等数据可能已过时。技术声明(如"零过期行错误")为项目自述,未经独立验证。