内部技术分享 / 2026-04-19
不是调 prompt,是把 AI 当成团队成员,
给它一个完整的工作环境。
agenda.toml
// background
早期:怎么让模型听我的话?
核心技能:写好提示词。
中期:怎么给模型最好的上下文?
核心技能:RAG、上下文压缩。
现在:怎么让 AI 靠谱地工作?
核心技能:软件工程 + AI 协同。
Harness 的本质:不是新技术,是软件工程全流程自动化
// what-is-harness
以前:人写代码 → 人跑测试 → 人 Review → 人部署
现在:AI 写代码 → Harness 兜底 → 人 Review → 流水线打包
// three-primitives
每个 Agent 有独立的工作空间。
Git submodule + 独立环境,
冲突在结构上不可能发生。
Agent 不擅长"帮我搞这个模块"。
擅长的是:你给我边界,
给我验收标准。
多 Agent 并行工作。
Supervisor 分配任务,
Worker 执行,Reviewer 审查。
隔离是前提 → 分解是基础 → 协调是最后一环
// feedback-loop
关键原则:反馈环路越短越精准,问题在第一层被拦住成本最低
// implementation · skill
SKILL 把运维经验封装成 AI 可调用的工具。
// implementation · openspec
OpenSpec 的核心创新是不重写完整规格,只记录变更的 diff。
一句话:把"模糊需求"变成"AI 能执行的精确规格",从而让 AI 的输出可预期、可验证
// implementation · mcp
AI 可以直接读生产数据、做 API 测试、执行部署——不需要人来回切换工具
协议层:Model Context Protocol
Anthropic 提出的工具调用标准
// implementation · multi-agent
MiniMax 模型
Oh My ClaudeCode
20+ 专项 Agent
Qwen 模型
50+ SKILL
项目定制能力
GPT-5.4 模型
SuperPower 技能
全流程覆盖
AI Code Review 已实际运行:资源组模块 → 发现 4 个严重问题 + 3 个高/中问题
代码生成速度 >> 人 Review 速度 → 所以让 AI Review AI
// implementation · code-standards
AGENTS.md 定义了团队约定,让 AI 知道什么该做、什么不该做。
// tools landscape
通过浏览器远程操控 Agent,适合手机/iPad 访问
本地桌面应用,管理 Agent 会话和文件
用看板组织多 Agent 任务,适合并行开发
OpenClaw 官方/社区工具,主打多会话管理
通过聊天软件远程操控 Agent,适合手机端
多 Agent 协作框架,适合团队作战
整理的 CodingAgent 工具库
这些工具本质上都是在利用 ClaudeCode、OpenCode 等 Coding Agent 的 CLI 能力,可用可不用,最简单的方法还是直接使用 CLI
// results
需求分析 + 设计 + 开发 + 单测 + API 测试 + 部署预估:12 人天
AI 生成 + Harness 兜底 + 人 Review
预估:4 人天
// gaps
// lessons-learned
用任务的方式组织 Agent
单一开发需求上,Vibekanban 的任务拆分反而是负担。Agent 本身就擅长处理模糊任务,不需要人先拆好。
多个 Agent 同时跑,人需要同时检查多个 Agent 的执行结果,变成了人在"监工"而不是人在"审核"。
用 Tmux 监工 Claude Code 等 Agent
Agent 执行过程中遇到问题,仍需要人介入决策。Tmux 监工变成了"人在旁边等着",并没有真正释放人的时间。
Openclaw + Tmux 的组合适合个人开发者小规模使用,扩展到团队多人协作时,沟通成本骤增。
核心教训:工具是为工作流服务的,不要为了用工具而用工具
// limitations
AI 代码生成速度 >> 人 Review 速度。
所以业界有了 AI Review AI。
AI 是工具,不是大脑。
Harness 是让 AI 靠谱 的工程手段,
不是让 AI 自主 的自动驾驶。
// summary
欢迎提问,一起探讨 AI 辅助开发的实践