你只跟一个人说话,但整条产线在运转:如何让 Agent 结队-「架构师 Agent」
Stavros:最强模型只做规划与调度;人类说出 approved 才落地。附架构师 Agent 提示词全文。
AI 对齐与工程 · 流程路径与任务编排
问题常在路径结构:这一步为啥存在、这轮有啥新证据、啥时候停、啥时候交接。答不上来,就只是在把日志写长。
概念地图
不是把步骤排队,而是写明每步的输入、输出、状态变化和停机条件。好编排会暴露空转,不会把空转包装成自动化。
节点、输入、输出、依赖画成可追踪图,别藏在口头描述或长 prompt 里。
切分粒度、阶段目标、停机条件:每个子任务要能产出新信息或决定下一步。
状态跃迁和门禁:何时进下一阶段,何时必须回退重审,避免在同一层空转。
交接写清事实、决策、未决项、验收标准,别让上下文在多人或多 agent 间丢光。
关键节点留中间证据:状态、判断依据、失败信号,流程才能回放和纠偏。
agent 很忙,团队却说不清有没有靠近目标——下面文章会直接点路径结构哪里断了。
Stavros:最强模型只做规划与调度;人类说出 approved 才落地。附架构师 Agent 提示词全文。
Task Brief 压扁决策空间后,用更省 token 的模型写码。附开发者 Agent 提示词全文。
换一家公司出的模型看 diff,才是第二双眼睛。附 code-reviewer 提示词全文(与 reviewerer 同源合并)。
行为摘要、风险热点、需求映射——不改仓、不联网。附 diff-summarizer 提示词全文。
用特征文件与代码样本说话,维护 ARCHITECTURE.md。附 repo-scout 提示词全文。
忙不等于逼近目标。把目标压成对象、步骤可证伪、反馈能纠偏、停机条件写死——否则再强的模型也只是更贵的空转。
分数回答不了「我们凭什么相信变好」;没有证据结构,评测只是把直觉做成仪表盘。