agency-agents 项目解析:把 AI 从单个助手变成一整支虚拟公司

agency-agents AI Agent 角色库与多智能体协作项目解析特色图

最近我看了一个很有意思的 GitHub 项目:msitarzewski/agency-agents。它的名字叫 agency-agents,直译有点像“代理公司里的代理人”,但更准确的理解应该是:一套把 AI 助手拆分成不同岗位专家的角色库

很多人用 AI 写代码、写文案、做方案时,习惯把所有事情都丢给同一个助手。但真实工作不是这样运转的。一个产品从想法到上线,中间会经过产品、设计、前端、后端、测试、运维、市场、客服、财务、合规等多个角色。agency-agents 做的事,就是把这些角色变成可复用的 AI Agent 提示词和工作流程。

一句话概括:它不是一个自动执行任务的平台,而是一套可安装到不同 AI 工具里的“虚拟专家团队模板”。

agency-agents 是什么?

从仓库结构看,agency-agents 本质上是一组 Markdown 文件。每个文件代表一个 Agent,里面包含这个 Agent 的身份、职责、工作流程、沟通方式、交付物、成功指标等内容。

比如它有前端开发、后端架构、DevOps、UI 设计、UX 研究、增长黑客、SEO 专家、测试分析、客服响应、财务分析等角色。每个角色不是简单一句“你是某某专家”,而是写了比较完整的工作方式和输出要求。

我本地查看当前仓库时,除去示例和集成文档,核心 Agent 文件大约有 184 个,分布在工程、设计、营销、产品、项目管理、测试、支持、金融、游戏开发、空间计算、学术、专业服务等多个分类里。它更像是一个“AI 组织架构库”。

它解决了什么问题?

普通提示词最大的问题是太散。今天你让 AI 做前端,它可能只关注页面;明天让它做安全检查,它又可能忽略业务目标。agency-agents 试图解决三个问题。

第一,角色边界。 不同 Agent 有不同职责。前端开发关注界面实现、性能和可访问性;Reality Checker 关注证据和验收;Project Shepherd 关注排期、依赖和风险。这比让一个通用助手什么都做更清晰。

第二,交付标准。 很多 Agent 文件里会写明它应该交付什么,比如代码、测试、架构图、审计报告、市场方案、复盘模板等。这会迫使 AI 不只聊天,而是输出可检查的结果。

第三,协作流程。 项目里还有一个叫 NEXUS 的策略层,用来把多个 Agent 组织成流程。它强调阶段、交接、质量门、证据验证和失败重试,目标是避免多 Agent 协作时各说各话。

它不是传统意义上的自动化框架

这一点很重要。agency-agents 不是 AutoGPT 那类自动执行系统,也不是一个带数据库、队列、浏览器自动化和工具调用的完整平台。它不会自己跑任务,也不会自动帮你部署项目。

它更像一套“岗位说明书 + SOP + 工作模板”。你把这些角色安装进 Claude Code、Gemini CLI、Cursor、OpenCode、Aider、Windsurf、Kimi Code、Qwen Code 等工具后,再在具体会话里调用某个角色,让它按预设方式工作。

这种设计的好处是轻量,坏处也很明显:真正的执行能力取决于你使用的 AI 工具本身。工具能读文件、改代码、跑测试,它就能做更多;工具只能聊天,它就更多是一个提示词模板。

项目结构大概长什么样?

仓库大致可以分成几层:

  • Agent 角色目录:engineering/design/marketing/testing/support/ 等,每个目录下都是具体 Agent。
  • strategy 目录:提供 NEXUS 协作方法,包括 Full、Sprint、Micro 等不同模式。
  • integrations 目录:提供不同 AI 工具的适配格式。
  • scripts 目录:提供 convert.shinstall.sh,用于转换格式和安装到本地工具。
  • examples 目录:展示多个 Agent 一起参与项目时可能产生的结果。

这种结构说明作者并不只是收集提示词,而是在尝试把提示词产品化、工具化、流程化。

怎么安装和使用?

如果你用的是 Claude Code,项目本身就比较贴近它的 Agent 格式,可以直接安装:

git clone https://github.com/msitarzewski/agency-agents.git
cd agency-agents
./scripts/install.sh --tool claude-code

如果你只想安装某一类角色,也可以手动复制:

cp engineering/*.md ~/.claude/agents/

如果你使用其他工具,可以先转换再安装:

./scripts/convert.sh
./scripts/install.sh

也可以指定工具:

./scripts/install.sh --tool gemini-cli
./scripts/install.sh --tool cursor
./scripts/install.sh --tool opencode
./scripts/install.sh --tool aider
./scripts/install.sh --tool windsurf

安装完成后,用法通常不是“运行 agency-agents”,而是在 AI 工具里调用某个角色。例如:

Activate Frontend Developer and help me build this React component.
Use Reality Checker to verify whether this feature is production-ready.
Activate Agents Orchestrator in NEXUS-Sprint mode for this MVP.

也就是说,它改变的是你和 AI 协作时的组织方式,而不是替你提供一个新的命令行运行时。

典型应用场景

1. 独立开发者做产品

一个人做产品时,最大的问题不是不会写代码,而是经常缺少多角色视角。你可能写完功能却忘了可访问性,做完页面却没有增长方案,准备上线却没做测试清单。agency-agents 可以让你快速切换到不同专家视角,补齐盲区。

2. 小团队做 MVP

NEXUS-Sprint 这类流程适合小团队把一个功能或 MVP 拆成产品、设计、工程、测试、上线几个阶段。即使团队只有两三个人,也可以让 AI 扮演 PM、QA、架构师、增长顾问,帮忙梳理计划和风险。

3. 代码库审查和上线前验收

项目里有 Code Reviewer、Security Engineer、Reality Checker、API Tester、Performance Benchmarker 等角色。它们适合在上线前做一轮审查:代码有没有明显风险,接口有没有验证,性能有没有证据,是否只是“看起来能跑”。

4. 内容和增长工作流

营销目录里有 SEO、Baidu SEO、小红书、知乎、微博、短视频、播客、跨境电商等角色。对内容型网站、独立产品、出海项目来说,这些 Agent 可以提供选题、渠道策略、内容结构和发布检查清单。

5. 企业内部知识工作 SOP

企业里很多工作本质上是可标准化的:客服回复、财务跟踪、合规审查、报告生成、销售提案、项目复盘。agency-agents 提供了一种思路:把岗位经验写成 Agent 模板,再让 AI 按模板执行。

可能产生的影响

第一,提示词会从“单条技巧”走向“组织资产”。 过去很多提示词只是个人收藏,复制粘贴就完了。但像 agency-agents 这样的项目,把角色、流程、交付标准和工具适配都放进仓库,提示词开始变得像代码一样可以版本管理、审查和协作。

第二,AI 工具会越来越像一个可扩展团队。 以前我们说 AI 助手,默认是一个通用助手。现在更像是你有一个工具箱,里面有 PM、设计、开发、测试、运营、法务等虚拟角色。真正的价值不只是单个回答更好,而是任务可以被更合理地拆分。

第三,个人生产力会继续被放大。 一个会调用 Agent 的独立开发者,可能比以前更容易完成完整产品闭环:从调研、设计、开发、测试、上线到推广。它不等于一个人能替代整个公司,但会显著提高个人完成复杂任务的上限。

第四,也会带来新的质量风险。 角色越多,不代表结果越可靠。如果没有证据、测试、人工判断,多 Agent 只会让错误变得更有条理。项目里强调 Reality Checker 和质量门是对的,因为 AI 最容易犯的错就是把“说得像真的”包装成“已经验证过”。

第五,团队管理方式会变化。 未来团队可能不只是管理人,还要管理 Agent:谁能改代码,谁能审查,谁负责合规,哪些输出必须有证据,哪些建议必须经过人类确认。这会让“AI 工作流治理”变成新的管理能力。

我怎么看这个项目?

我觉得 agency-agents 最有价值的地方,不是它有多少个 Agent,而是它把“AI 协作”从聊天框里拽回了工程化思路:角色定义、流程拆分、交接模板、质量门、工具适配、版本管理。

它的不足也很明显。首先,它仍然主要是提示词资产,不是完整运行时;其次,不同 Agent 的质量会有差异,需要根据自己的业务重写;第三,如果直接全量安装,很容易信息过载。真正好的用法不是一口气使用 184 个角色,而是从 5 到 10 个最常用角色开始,逐步沉淀自己的版本。

对技术人来说,我更建议把它当成一个参考库:学习它如何定义角色、如何写交付标准、如何设计多 Agent 交接,再把其中适合自己的部分改造成个人或团队的工作流。

适合谁使用?

  • 经常使用 Claude Code、Cursor、Gemini CLI、OpenCode、Aider 等 AI 编程工具的人。
  • 独立开发者、站长、小团队,需要一个低成本的虚拟协作团队。
  • 想把提示词系统化、版本化、团队共享的人。
  • 正在研究 AI Agent 工作流、工具链集成、多 Agent 协作的人。
  • 需要给企业内部岗位沉淀 AI SOP 的团队。

不适合谁?

  • 只想要一个开箱即用 SaaS 平台的人。
  • 不愿意阅读和改造提示词,只想一键自动完成所有工作的人。
  • 没有验证流程,却希望 AI 自动替自己做关键决策的人。
  • 对数据隐私、代码权限、业务边界没有控制意识的团队。

结语

agency-agents 代表了一种很明确的趋势:AI 不再只是“一个更聪明的聊天框”,而会逐渐变成一套可组织、可分工、可复用的工作系统。

它不会直接替你创业,也不会自动替你把项目做完,但它提供了一套很好的脚手架,让你用更接近真实团队协作的方式使用 AI。对于个人开发者来说,这可能就是从“我有一个 AI 助手”升级到“我有一支虚拟工作队”的开始。

参考资料